-
HEREDITermCorpus_pt_V0_1_HEREDITARY项目_葡萄牙语微生物群_肠_脑轴文本语料库
2025年12月27日 30 161 40
数据集概述 本数据集是HEREDITARY项目下的葡萄牙语文本语料库,聚焦微生物群-肠-脑轴(MGBA)及其在神经退行性疾病中的作用,包含126篇文档、100,610个句子、约200万词汇和267万词元,为相关领域研究提供结构化文本资源。 文件详解 文件名称:HerediTermCorpus_pt.xlsx 文件格式:XLSX...
-
MEDDOCAN西班牙语临床病例报告匿名化标注数据集
2025年12月16日 30 70 69
数据集概述 该数据集包含MEDDOCAN共享任务的训练、开发、测试集(含黄金标准标注)及背景集(无标注),用于西班牙语临床病例报告的文档匿名化研究。标注采用Brat和XML格式,支持格式转换,为医学文本去标识任务提供标准化数据。 文件详解 文件名称: meddocan.zip 文件格式: ZIP压缩包 内容说明:...
-
乌兹别克语与英语手术术语比较分析
2025年12月16日 30 89 19
数据集概述 本数据集为一份关于乌兹别克语与英语手术术语比较分析的文档,聚焦两种语言中手术术语的对比研究,以单一PDF文件形式呈现,为医学术语跨语言研究提供资料支持。 文件详解 文件名称: Gulhayo Bobomuradova.pdf 文件格式: PDF (.pdf) 文件内容:...
-
癌症健康差异驱动因素BERTopic建模与PyCaret评估文本数据集
2025年12月14日 30 35 14
数据集概述 本数据集围绕癌症健康差异驱动因素展开,通过BERTopic建模与PyCaret评估分析PubMed癌症健康差异相关摘要文本。数据经生物信息学工具获取与预处理,聚焦社会、行为等多维度变量对癌症治疗差异的影响,为识别差异驱动因素提供支持。 文件详解 文件名称:...
-
多语言临床病例报告摘要数据集2025
2025年12月13日 30 182 82
数据集概述 该数据集为CLEF 2025 BioASQ研讨会MultiClinSum共享任务所用,包含英、西、法、葡四种语言的临床病例报告全文与对应摘要对,分黄金标准训练集、大规模训练集和测试集,支持多语言临床文本自动摘要研究。 文件详解 该数据集包含12个ZIP格式压缩文件,按语言和用途分类如下: - 黄金标准训练集(各语言592对全文与摘要): -...
-
SympTEMIST症状体征信息抽取标注数据集
2025年12月4日 30 147 97
数据集概述 该数据集是针对西班牙语文档中症状、体征和检查结果进行信息抽取的标注资源,包含任务训练测试集、SNOMED术语词表、九种语言的银标准数据及一万五千余例临床病例背景集,为医学文本挖掘研究提供标准化标注数据。 文件详解 文件名称: symptemist-complete_240208.zip 文件格式: ZIP压缩包 包含内容:...
-
医学文本信息抽取验证数据集
2025年10月10日 30 68 17
医学文本信息抽取验证数据集_Medical_Text_Information_Extraction_Validation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 文本标注, 机器学习, 自然语言处理, 医疗健康 数据概述:...
-
医学文本信息实体识别与预测数据集
2025年9月20日 30 118 28
医学文本信息实体识别与预测数据集_Medical_Text_Information_Entity_Recognition_and_Prediction 数据来源:互联网公开数据 标签:医学文本, 实体识别, 文本标注, 生物医学, 机器学习, 自然语言处理, 预测模型, 医疗健康 数据概述:...
-
医学文本命名实体识别预测提交数据集
2025年7月31日 30 169 164
医学文本命名实体识别预测提交数据集_Medical_Text_Named_Entity_Recognition_Prediction_Submission 数据来源:互联网公开数据 标签:命名实体识别, 医学文本, 自然语言处理, 预测, 临床, 医疗健康, 数据分析, 机器学习 数据概述:...
-
医学文本信息抽取评估数据集
2025年7月22日 30 120 8
医学文本信息抽取评估数据集_Medical_Text_Information_Extraction_Evaluation_Dataset 数据来源:互联网公开数据 标签:医学文本, 信息抽取, 命名实体识别, 关系抽取, 评估数据集, 深度学习, 自然语言处理, 文本标注 数据概述:...
-
医学病例特征标注与文本分析数据集MedicalCaseFeatureAnnotationandTextAnalysisDataset-arvinddevarkonda
2025年5月30日 30 87 81
医学病例特征标注与文本分析数据集MedicalCaseFeatureAnnotationandTextAnalysisDataset-arvinddevarkonda 数据来源:互联网公开数据 标签:医学文本, 命名实体识别, 文本标注, 临床病例, 特征提取, 自然语言处理, 机器学习, 医疗健康 数据概述:...
-
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999
2025年5月29日 30 26 4
医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999 数据来源:互联网公开数据 标签:医学文本, 文本分类, 疾病诊断, 医疗研究, 自然语言处理, 机器学习, 语料库, 临床医学 数据概述: 该数据集包含来自医学文献的文本数据,记录了用于疾病诊断和医学研究的文本片段。主要特征如下:...
-
帕金森病PD患者文章摘要生成数据集Parkinson-sDiseaseArticleAbstractGenerationDataset-jaskiratjk
2025年5月29日 30 64 8
帕金森病PD患者文章摘要生成数据集Parkinson-sDiseaseArticleAbstractGenerationDataset-jaskiratjk 数据来源:互联网公开数据 标签:帕金森病, 摘要生成, 文本摘要, 医学文本, 自然语言处理, 机器学习, 神经退行性疾病, 文本分析 数据概述:...
-
癌症研究文本情感分析数据集CancerResearchTextSentimentAnalysisDataset-sohammhatre112
2025年5月29日 30 190 18
癌症研究文本情感分析数据集CancerResearchTextSentimentAnalysisDataset-sohammhatre112 数据来源:互联网公开数据 标签:癌症研究, 文本情感分析, 医疗健康, 自然语言处理, 情感分类, 医学文本, 机器学习, 数据标注 数据概述:...
-
医学文本数据去噪与词嵌入数据集MedicalTextDataDenoisingandWordEmbedding-vobachkhoi
2025年5月14日 30 125 73
医学文本数据去噪与词嵌入数据集MedicalTextDataDenoisingandWordEmbedding-vobachkhoi 数据来源:互联网公开数据 标签:医学文本, 自然语言处理, 词嵌入, 数据去噪, 文本分析, 预训练模型, 临床记录, 数据清洗 数据概述:...
-
医学文本疾病分类数据集MedicalTextDiseaseClassification-iabyss
2025年5月13日 30 62 27
医学文本疾病分类数据集MedicalTextDiseaseClassification-iabyss 数据来源:互联网公开数据 标签:医学文本, 疾病分类, 自然语言处理, 文本挖掘, 临床研究, 病理学, 机器学习, 数据标注 数据概述:...
-
医学文本分类诊断数据集MedicalTextClassificationDiagnosticDataset-nafiyaahmed66048
2025年5月13日 30 16 0
医学文本分类诊断数据集MedicalTextClassificationDiagnosticDataset-nafiyaahmed66048 数据来源:互联网公开数据 标签:医学文本, 诊断分析, 文本分类, 疾病诊断, 自然语言处理, 机器学习, 医疗健康, 数据标注 数据概述:...
-
医学文献命名实体识别训练数据集MedicalLiteratureNamedEntityRecognitionTrainingDataset-jiashangliuliu
2025年5月11日 30 57 45
医学文献命名实体识别训练数据集MedicalLiteratureNamedEntityRecognitionTrainingDataset-jiashangliuliu 数据来源:互联网公开数据 标签:命名实体识别, 医学文本, 生物医学, 文本标注, 序列标注, 机器学习, 疾病识别, 语料库 数据概述:...
-
医学文本分类数据集MedicalTextClassificationDataset-avivstats
2025年5月8日 30 20 3
医学文本分类数据集MedicalTextClassificationDataset-avivstats 数据来源:互联网公开数据 标签:医学, 文本分类, 疾病诊断, 自然语言处理, 癌症研究, 生物医学, 机器学习, 语料库 数据概述: 该数据集包含来自医学文献的文本数据,记录了用于疾病分类的医学报告摘要。主要特征如下:...
-
医疗记录文本摘要数据集MedicalRecordTextSummaryDataset-rohit4567
2025年4月29日 30 117 101
医疗记录文本摘要数据集MedicalRecordTextSummaryDataset-rohit4567 数据来源:互联网公开数据 标签:医疗记录, 文本摘要, 医学文本, 自然语言处理, 医疗诊断, 临床数据, 文本分析, 数据挖掘 数据概述:...



