HEREDITermCorpus_pt_V0_1_HEREDITARY项目_葡萄牙语微生物群_肠_脑轴文本语料库

数据集概述

本数据集是HEREDITARY项目下的葡萄牙语文本语料库,聚焦微生物群-肠-脑轴(MGBA)及其在神经退行性疾病中的作用,包含126篇文档、100,610个句子、约200万词汇和267万词元,为相关领域研究提供结构化文本资源。

文件详解

  • 文件名称:HerediTermCorpus_pt.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:未提供具体字段信息,推测包含葡萄牙语文本内容及与MGBA、神经退行性疾病相关的语义数据(无预览内容,具体字段需参考文件)

数据来源

HEREDITARY项目(HetERogeneous sEmantic Data integratIon for the guT-brAin interplay)

适用场景

  • NLP模型训练: 用于葡萄牙语领域的文本分类、命名实体识别等自然语言处理任务模型训练
  • 语义数据整合研究: 支持微生物群-肠-脑轴相关语义信息的提取与整合分析
  • 神经退行性疾病机制研究: 辅助挖掘MGBA与神经退行性疾病关联的文本证据
  • 多语言医学语料库构建: 作为葡萄牙语医学文本资源补充多语言语料库体系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.04 MiB
最后更新 2025年12月27日
创建于 2025年12月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。