数据2型糖尿病候选基因文本挖掘参考数据集

数据集概述

该数据集是用于2型糖尿病候选基因文本挖掘的参考数据,包含疾病-基因关联的证据或参考句子,将关联信息分为Yes、No、Ambiguous、X四类,对应正负关联、模糊关联及无关关联,为训练文本挖掘分类器提供支持。

文件详解

  • 文件名称:Supplementary_File_1.xlsx、Supplementary_File_2.xlsx、Supplementary_File_3.xlsx、Supplementary_File_4.xlsx
  • 文件格式:XLSX(Excel表格)
  • 内容说明:均为支持2型糖尿病候选基因文本挖掘的参考数据文件,包含疾病-基因关联的分类标注信息,具体字段未提供预览

适用场景

  • 生物信息学研究:训练基于文本挖掘的生物文献分类器,预测2型糖尿病相关基因关联
  • 医学文本分析:开发针对疾病-基因关联的自然语言处理(NLP)模型
  • 糖尿病机制研究:通过文本挖掘结果开展2型糖尿病系统级分析
  • 跨疾病扩展应用:为其他疾病的基因关联文本挖掘提供参考框架
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 95.54 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。