数据集概述
本数据集是HEREDITARY项目下的HEREDITermCorpus_en_V0.1,为肠道-大脑相互作用研究构建的多语言语料库英文版本,包含经筛选的微生物群-肠道-大脑轴(MGBA)及神经退行性疾病相关英文文本,覆盖1,060份文档、234,215个句子、4,132,486个单词及6,029,603个标记,供研究人员、临床医生和学生使用。
文件详解
- 文件名称:HerediTermCorpus_en.xlsx
- 文件格式:XLSX
- 字段映射介绍:未提供具体字段映射,文件为单一数据文件,包含微生物群-肠道-大脑轴及神经退行性疾病相关英文文本内容,涵盖文档、句子、单词及标记级别的语义数据。
数据来源
HEREDITARY项目(HetERogeneous sEmantic Data integratIon for the guT-brAin interplay)
适用场景
- 肠道-大脑轴研究: 分析微生物群对大脑健康及神经退行性疾病机制的影响。
- 语义数据整合研究: 探索多源异构语义数据在生物医学领域的整合方法。
- 神经科学文本挖掘: 基于语料库开展MGBA相关文献的文本分析与知识发现。
- 医学教育资源: 为学生和临床医生提供肠道-大脑相互作用领域的结构化文本学习材料。