Not_Scared_of_Chemistry_Based_多源整合化学知识图谱数据

数据集概述

本数据集是整合ExCAPE-DB、BioGRID、HomoloGene及化学相似性数据构建的知识图谱,包含元数据文件和三元组文件,原始数据采用CC-0 1.0协议,衍生数据遵循各源数据许可协议,由nsockg工具自动生成。

文件详解

  • metadata.json
  • 文件格式:JSON
  • 字段映射介绍:包含date(日期)、exporter(导出工具)、versions(版本信息)、statistics(统计信息)四个键值对,记录知识图谱的元数据信息
  • triples.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含化学物质与基因的调控关系三元组,示例内容为inchikey(化学物质标识)、modulates(关系类型)、ncbigene(基因标识)的组合

数据来源

https://github.com/cthoyt/nsockg

适用场景

  • 化学信息学研究: 用于分析化学物质与基因之间的调控关系
  • 知识图谱构建参考: 为多源生物化学数据整合构建知识图谱提供示例
  • 药物靶点预测: 基于化学物质-基因调控关系挖掘潜在药物靶点
  • 生物数据跨库关联分析: 整合ExCAPE-DB、BioGRID、HomoloGene多源数据开展关联研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 182.94 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。