化合物数据库化学性质及结构数据集CompoundDatabaseChemicalPropertiesandStructures-desertman

化合物数据库化学性质及结构数据集CompoundDatabaseChemicalPropertiesandStructures-desertman

数据来源:互联网公开数据

标签:化合物, 化学, 结构, 性质, 数据库, 生物化学, 分子, 数据整合

数据概述: 该数据集包含来自多个化合物数据库的结构化数据,记录了各种化合物的化学性质和分子结构信息。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态化合物信息集合。 地理范围:数据覆盖全球范围内的化合物,主要基于生物化学、药物化学等领域。 数据维度:数据集包含多种化合物的详细信息,包括: cid:化合物的唯一标识符。 cmpdname:化合物的通用名称。 cmpdsynonym:化合物的同义词。 mw:分子量。 mf:分子式。 polararea:极性表面积。 complexity:复杂度。 xlogp:xlogP值,表示化合物的脂溶性。 heavycnt:重原子数量。 hbonddonor:氢键供体数量。 hbondacc:氢键受体数量。 rotbonds:可旋转键的数量。 inchi:国际化学标识符。 isosmiles:异构体SMILES字符串。 inchikey:InChIKey,一种简化版的InChI。 iupacname:国际纯粹与应用化学联合会命名。 meshheadings:医学主题词。 annothits:注释命中数。 annothitcnt:注释命中计数。 aids:活性标识符。 cidcdate:化合物创建日期。 sidsrcname:来源数据库名称。 depcatg:依赖类别。 annotation:注释信息。 数据格式:CSV格式,包含MONA_compounds.csv、biocyc_compounds.csv、hmdb_compounds.csv、kegg_compounds.csv、lipidmaps_compounds.csv、mesh_compounds.csv、pathbank_compounds.csv、pubchem_pubmed_compounds.csv、refmet_compounds.csv等多个文件,便于数据分析和整合。 该数据集适合用于化学、生物化学、药物研发等领域的研究和应用。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于化学信息学、药物化学、生物化学等领域的学术研究,例如化合物性质预测、分子结构分析、药物靶标识别等。 行业应用:可为药物研发、材料科学、环境科学等行业提供数据支持,例如药物筛选、化合物设计、毒性预测等。 决策支持:支持科研机构和企业在化合物相关研究和开发中的决策制定,例如新药研发策略、化合物筛选流程优化等。 教育和培训:作为化学、生物化学等相关专业课程的辅助材料,帮助学生和研究人员深入理解化合物的结构和性质。 此数据集特别适合用于探索化合物结构与性质之间的关系,以及在不同数据库之间进行数据整合和比较分析,从而加速药物发现和材料研发的进程。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 227.58 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。