疾病基因药物关联知识图谱数据集DiseaseGeneDrugAssociationKnowledgeGraphDataset-wanjinodou
数据来源:互联网公开数据
标签:生物医学, 知识图谱, 疾病, 基因, 药物, 关联分析, 数据挖掘, 关系抽取
数据概述:
该数据集包含来自生物医学文献和数据库的知识,记录了疾病、基因和药物之间的关联关系。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态知识快照。
地理范围:数据来源于全球范围内的生物医学研究。
数据维度:数据集包含疾病、基因、药物及其相互关系,具体字段包括SUBJECT_CUI(主题概念唯一标识符)、SUBJECT_(主题概念)、OBJECT_CUI(客体概念唯一标识符)、OBJECT_(客体概念)、SUBJECT_SEMTYPE(主题语义类型)、OBJECT_SEMTYPE(客体语义类型)和PMID(PubMed文献标识符)。
数据格式:CSV格式,包含pathoge_genecsv、pathoge_diseasecsv和drug_diseasecsv三个文件,便于关系抽取和知识图谱构建。
来源信息:数据来源于生物医学领域公开数据集和文献。
该数据集适合用于生物医学知识图谱构建、疾病与药物关联分析以及基因功能研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于生物医学领域的学术研究,如疾病机理研究、药物靶点发现、基因功能分析等。
行业应用:可以为制药公司、生物技术公司提供数据支持,尤其是在新药研发、药物筛选、个性化医疗等方面。
决策支持:支持医疗机构和科研机构的临床决策和科研方向规划。
教育和培训:作为生物信息学、医学信息学等相关课程的辅助材料,帮助学生和研究人员深入理解生物医学知识。
此数据集特别适合用于探索疾病、基因和药物之间的复杂关系,从而加速新药研发进程,提高疾病诊断和治疗水平。