-
JCIM_稿件附件及机器可读文件
2026年2月15日 30 197 136
数据集概述 本数据集为JCIM(《化学信息与建模杂志》)手稿的支持信息和机器可读文件集合,包含10个文件,涵盖分子结构、分子相互作用分析及QSAR训练测试集等内容,用于辅助理解手稿中的研究方法与结果。 文件详解 .pse格式文件(共6个)...
-
数据2D_2D异质结构设计数据集的Swarm智能元估计器
2026年1月30日 30 17 12
数据集概述 本数据集为Swarm智能元估计器在2D/2D异质结构设计领域的相关数据,包含代码文件、说明文档、数据集文件及许可文件,共4个文件,无目录层级,未划分训练测试集或数据标签集。 文件详解 LICENSE.txt:TXT格式,包含BSD 3-Clause License许可内容,涉及版权声明及使用条件...
-
GNPS_Based_正离子模式质谱预处理数据集_2020
2026年1月29日 30 175 61
数据集概述 本数据集为从GNPS平台获取的正离子模式质谱数据经清洗和预处理后的成果,包含112,956条正离子模式光谱。其中92,954条光谱附带Smiles和InchiKey(前14字符有13,717个唯一值),可用于质谱分析相关研究。 文件详解...
-
莱丘加化学信息与建模杂志表面活性剂皮肤刺激性预测分类模型数据集
2026年1月29日 30 56 50
数据集概述 本数据集为表面活性剂皮肤刺激性预测分类模型相关数据,来自Lechuga等人发表于《Journal of Chemical Information and Modeling》的研究。数据集包含构建该预测模型所需的相关信息,以单文件形式呈现,支持化学信息学领域对表面活性剂皮肤刺激性预测模型的研究与应用。 文件详解...
-
利用ECP预测不同本地安全环境下化合物的安全性评估_SAR_结果
2026年1月28日 30 49 33
数据集概述 本数据集包含论文中报告的15个数据集的SD文件,每个数据集以CHEMBL靶点ID标识。数据用于不同局部SAR环境下的化合物预测研究,包含描述文件和压缩数据包两类文件,总计2个文件。 文件详解 说明文件: 文件名称:description.txt 文件格式:TXT 字段映射介绍:记录数据集的核心说明,包括研究标题、数据集数量及标识规则等信息。...
-
LOTUS_Initiative_开放天然产物研究生物化学树数据
2026年1月28日 30 11 6
数据集概述 本数据集来自LOTUS开放天然产物研究计划,包含基于冻结元数据构建的生物树和化学树,元数据来源示例为PubChem。数据集共包含两个JSON文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理数据集。 文件详解 文件名称:tree_bio.json 文件格式:JSON...
-
ChEMBL_Based_31组人类靶点活性化合物回归建模数据集
2026年1月28日 30 139 38
数据集概述 本数据集从ChEMBL 17版本中筛选出31组化合物数据,用于回归建模。筛选条件包括:针对人类靶点的直接抑制/结合实验、最高ChEMBL置信评分、Ki值低于100微摩尔;相同化合物的多Ki值按数量级平均或剔除;移除重复、泛实验干扰及反应性分子;仅保留至少500个化合物的数据集。 文件详解...
-
IDSl_UFA_Based_数据库大小对分子式注释排名影响数据
2026年1月28日 30 172 137
数据集概述 本数据集聚焦于真实标准品数据集场景下,数据库大小对分子式注释排名的影响。核心内容为相关分析结果,包含1个文件,用于展示数据库规模变化如何改变分子式注释的排名情况,为化学信息学研究提供数据支持。 文件详解 文件名称:Figure_S.5.xlsx 文件格式:XLSX...
-
S51_NORMAN_WRI_GC_HRMS目标列表数据_2019
2026年1月27日 30 116 71
数据集概述 本数据集是NORMAN Suspect List Exchange平台上S51 WRIGCHRMS相关的GC-HRMS目标化合物列表,由斯洛伐克水资源研究所(WRI)提供并经EI/UoA整理,包含化合物的名称、SMILES结构、分子式等化学信息,共3个文件。 文件详解 WRIGCHRMS_04042019.csv 文件格式:CSV...
-
STLs_Based_被子植物倍半萜内酯结构分类与骨架多样性数据集
2026年1月27日 30 10 6
数据集概述 本数据集包含被子植物中倍半萜内酯(STLs)的结构分类与骨架多样性相关信息。主要记录了超过5200种STLs的植物来源,涵盖8600余条条目,涉及骨架类型分类、分子骨架多样性分析、2D指纹与聚类分析等内容,是研究被子植物STLs化学多样性的结构化参考资料。 文件详解...
-
MoleculeResolver_Based_分子解析基准测试数据集
2026年1月27日 30 196 71
数据集概述 本数据集为MoleculeResolver基准数据集,包含1个.xlsx格式文件,未划分训练/测试集、数据/标签集或原始/处理集,无自述文件或内容预览,用于分子解析相关的基准测试场景。 文件详解 文件名称:MoleculeResolver_datasets.xlsx 文件格式:XLSX...
-
Compound_Based_聚合物改性与药物合成化合物结构及光谱数据
2026年1月26日 30 173 64
数据集概述 本数据集包含博士论文中涉及的聚合物改性与药物合成相关化合物的结构数据(如IUPAC名称、InChI、SMILES等)和光谱数据(NMR、MS),结构数据由ChemDraw v.20生成,NMR数据来自Bruker Avance系列光谱仪,可用于化合物的结构验证与合成工艺分析。 文件详解...
-
IAM_Graph_Database_化学化合物HIV活性分类数据集
2026年1月25日 30 136 113
数据集概述 本数据集源自AIDS抗病毒筛选数据库的活性化合物,包含两千种化学化合物,部分为非连接结构。这些化合物按HIV活性分为训练集、验证集和测试集,用于支持图模式识别与机器学习模型的训练、参数优化及测试。 文件详解 压缩文件 文件名称:Fingerprint.zip、Letter.zip、AIDS.zip、Protein.zip、COIL-...
-
NORMAN_SLE_S6_ITNANTIBIOTIC抗生素清单数据
2026年1月23日 30 34 28
数据集概述 本数据集是NORMAN可疑物质清单交换平台(SLE)中S6 ITNANTIBIOTIC清单相关的抗生素集合,包含抗生素及其CYP代谢物信息,由Nikiforos Alygizakis编译,Tim Jonkers通过BioTransformer生成代谢物数据,可用于抗生素代谢与环境研究,共6个文件。 文件详解 抗生素基础信息文件...
-
Nat_UV_DB_Based_墨西哥天然产物数据库化学信息学分析数据
2026年1月22日 30 153 29
数据集概述 本数据集为墨西哥天然产物数据库Nat-UV DB的化学信息学分析数据,包含经过整理的数据库文件、高频骨架分析结果及代码压缩包,用于支持天然产物的化学信息学研究与分析,共3个文件。 文件详解 FinalDB_ForPaper_DB_cured.csv 文件格式:CSV...
-
S55_ZINC15PHARMA_NORMAN网络药物清单数据集_2020
2026年1月21日 30 77 66
数据集概述 本数据集为NORMAN可疑物质清单交换平台的S55 ZINCPHARMA列表,包含从ZINC15获取的八千六百余种药物信息,由雅典大学Reza Aalizadeh整理提供。2020年11月6日更新删除了碳酸盐的错误CAS号,含3个文件,覆盖药物化学结构、属性与标识符等信息。 文件详解 ZINC15PHARMA.csv 文件格式:CSV...
-
Machine_Learning_Based_机器学习增强RPLC_HRMS非靶向工作流识别概率补充数据
2026年1月1日 30 209 89
数据集概述 本数据集为机器学习增强RPLC/HRMS非靶向工作流识别概率研究的补充数据,包含5个Excel文件,内容涉及模型训练用化合物列表、累积中性损失质量数据、串联质谱训练数据、RTI预测误差结果及基质匹配验证数据,支撑相关模型的训练与验证。 文件详解 Additional file...
-
ThesisDataset_RNA_binders_Based_化学信息学RNA结合配体分类数据集_2024
2025年12月28日 30 87 62
数据集概述 本数据集为Ing. Jozef Fülöp(布拉格化工学院,2024)的硕士论文“Cheminformatics Analysis of RNA-Binding Ligands”相关数据,包含RNA结合分子分类的原始及处理数据,分为Set1 Large(77,420个化合物)和Set2...
-
用于训练结构匹配与识别引擎SMARE的手绘化学分子式数据集
2025年12月23日 30 24 2
数据集概述 本数据集包含一千八百四十四张用于训练和评估SMARE模型的手绘化学结构元素图像,标注有十八类化学结构相关类别,涉及原子、化学键等核心化学结构要素,为化学结构识别模型开发提供数据支持。 文件详解 LICENSE.txt:TXT格式,包含知识共享署名4.0国际公共许可证(CC BY 4.0)的授权条款...
-
chemoinformatics与计算药物化学数据集
2025年12月22日 30 174 151
数据集概述 本数据集是实验室开发的免费注释化合物数据集与软件工具的一部分,用于 chemoinformatics 与计算药物化学领域。原始版本已发表,更新版本将在后续数据笔记中说明,提供相关研究的数据支持。 文件详解 文件类型:均为.zip格式,共32个压缩文件...



