找到73个数据集

标签: SMILES

过滤结果
  • DECIMER_手绘分子图像数据集

    2025年12月19日 30 57 5

    数据集概述 该数据集是包含五千零八十八个手绘化学结构图像的标准化基准数据集,每个图像对应分子的机器可读表示,旨在支持光学化学结构识别领域的研究,采用CC-BY 4.0许可协议开放共享。 文件详解 数据集信息文件: DECIMER_HDM_Person_dataset_info.csv:...
    packageimg
  • PocketVina分子对接研究数据集

    2025年12月19日 30 11 8

    数据集概述 本数据集为PocketVina分子对接框架相关研究资料,包含研究结果压缩文件及TargetDock-AI基准数据集。PocketVina可实现高效物理有效对接,数据集支持相关算法性能验证与分析,助力药物发现领域研究。 文件详解...
    packageimg
  • 欧洲小型河流AI辅助慢性混合风险评估数据集

    2025年12月18日 30 45 4

    数据集概述 本数据集为AI辅助多场景慢性混合风险评估提供支持,包含2021年德国中部Holtemme河六个采样点的河流水样本分析数据,以及TRIDENT模型预测结果和风险评估相关文件,覆盖藻类、无脊椎动物、鱼类等生物的慢性毒性预测及风险评估脚本。 文件详解 该数据集包含14个文件,具体说明如下: - 说明文档: -...
    packageimg
  • 互变异构体对_cheminformatics_处理及_QSAR_QSPR_建模影响研究数据集

    2025年12月18日 30 19 3

    数据集概述 本数据集为研究互变异构体对化学信息学处理及QSAR/QSPR建模影响的补充材料,包含互变异构体生成、指纹计算、模型应用与构建相关的多类型文件,支持探索互变异构体对建模全流程的作用。 文件详解 互变异构体生成文件: methimazole_tautomers.smi:SMI格式,含甲巯咪唑的互变异构体SMILES线性表示 指纹计算结果文件:...
    packageimg
  • 数据298_15K气相标准摩尔生成焓基团贡献模型数据集

    2025年12月8日 30 12 11

    数据集概述 本数据集包含基于加和方案构建的多个气相标准摩尔生成焓基团贡献模型,通过Ambit-GCM软件完成模型构建,主要用于演示该软件的使用,含训练、测试数据及模型结果文件。 文件详解 模型描述文档: Hf_modelDescription.pdf:PDF格式,可能包含基团贡献模型的构建方法、参数说明等理论背景 数据文件:...
    packageimg
  • 含官能团基准分子数据库

    2025年12月15日 30 108 63

    数据集概述 该数据集包含156个分子的计算数据,每个分子对应约800个构象。数据以支持CRUD操作的数据库形式存储,每个分子和构象均有唯一标识符,分子关联对应的官能团信息,同时提供官能团说明的PDF文档,便于分子数据的管理与检索。 文件详解 文件名称:...
    packageimg
  • 新冠病毒大流行背景下深度学习与物理对接工具对比数据集

    2025年12月15日 30 13 0

    数据集概述 该数据集围绕新冠病毒大流行背景,提供深度学习与物理对接工具的相关数据,包含数据预处理脚本、不同对接工具的结果文件、多序列比对文件及模拟输入文件等,为相关研究提供数据支持。 文件详解 DataProcessing.zip:压缩文件,包含数据预处理的脚本及中间文件,用于从pdb文件中提取SMILES和蛋白质坐标 docking-...
    packageimg
  • QM9数据集分子结构分类数据集

    2025年12月13日 30 60 16

    数据集概述 该数据集包含QM9数据集中所有分子结构的ClassyFire分类结果,覆盖近十四万种含碳、氮、氧、氟原子的有机分子,通过DFT优化为稳定结构,为分子分类研究提供结构化数据支持。 文件详解 文件名称:QM9_jsons_classified.tar.gz 文件格式:GZ压缩包(.tar.gz)...
    packageimg
  • 天然产物作为色氨酸2_3_双加氧酶抑制剂的计算筛选数据集

    2025年12月13日 30 117 107

    数据集概述 该数据集为天然产物作为色氨酸2,3-双加氧酶抑制剂的计算筛选研究数据,包含基于CNN的QSAR模型、分子对接、ADMET分析及分子动力学模拟相关的模型文件、数据文件和可视化结果,支持抑制剂筛选的计算分析。 文件详解 该数据集包含19个文件,按类型分类如下: - 数据文件(CSV格式,共12个): -...
    packageimg
  • NORMAN_MassBankEU_Based_化合物结构与质谱数据完整分析

    2025年12月13日 30 17 6

    数据集概述 本数据集是NORMAN可疑物清单交换平台中S1清单关联的MASSBANK化合物集合,包含化合物基本信息、质谱数据及结构标识等内容,为化学物质分析与识别提供支持。 文件详解 该数据集包含4个文件,具体说明如下: - 综合化合物数据文件: -...
    packageimg
  • CGIP_Based_分子参数与突变体分析数据可视化完整数据集

    2025年12月13日 30 46 23

    数据集概述 该数据集包含与CGIP相关的分子参数数据及可视化图表,涵盖分子属性统计数据和化合物与突变体比例、聚类热图等分析结果,为相关研究提供数据支持。 文件详解 数据文件: lipinski_parameters_250308.csv: CSV格式,包含化合物分子参数数据,字段包括Compounds、SMILES、Molecular Weight...
    packageimg
  • 心脏离子通道小分子活性综合数据集

    2025年12月12日 30 188 10

    数据集概述 该数据集是一个面向药物发现领域的综合数据库,涵盖hERG、Nav1.5和Cav1.2三种心脏离子通道的小分子活性数据。数据以压缩文件形式组织,每个离子通道目标包含开发集(含训练/验证子集)及两个不同结构相似度阈值的外部测试集,为离子通道毒性预测模型的构建与评估提供标准化数据支持。 文件详解 压缩文件: dataset.rar:...
    packageimg
  • 化学子结构搜索_SQL论文表2数据集

    2025年12月12日 30 4 3

    数据集概述 本数据集源自《Chemical Substructure Search in SQL》论文的表2内容,包含15条化学查询的原始数据及处理后的14条有效SMILES表达式与描述信息,为化学子结构搜索技术研究提供基础数据支持。 文件详解 文件名称:README 文件格式:无扩展名 内容:数据集说明文档,包含数据来源、处理过程及版本历史等信息...
    packageimg
  • 核受体活性数据集_NURA

    2025年12月8日 30 210 112

    数据集概述 该数据集收集了调节核受体(NRs)的小分子的精选信息,包含15247个分子和11种选定核受体的生物活性注释,用于药理学和毒理学应用,是现有相关数据库的整合与扩展。 文件详解 核心数据文件: Nura_v1.0.0.csv:CSV格式,包含每个分子(行,以唯一ID和规范SMILES字符串标识)和每个核受体端点(列)的活性标签...
    packageimg
  • ExcusomeBootCamp_MetFrag_Based_暴露组学MetFrag实践教学与测试完整数据_注_根据_中文主导原则_文件名中保留_Expo...

    2025年12月7日 30 24 20

    数据集概述 本数据集是Exposome Boot Camp中“MetFrag实践”实验的全套材料,包含用于实践操作的结构化数据文件、实验指南文档及示例文件,为开展MetFrag相关的暴露组学分析提供完整资源支持。 文件详解 实验指南文档 1_ExposomeBootCamp_Jul2019_MetFrag.pdf:PDF格式,包含实验概述信息 示例文件...
    packageimg
  • 柑橘属植物生物活性物质与慢性静脉疾病治疗潜力数据集

    2025年12月5日 30 124 87

    数据集概述 该数据集聚焦柑橘属植物的生物活性物质,收集并分析其化学空间特征,通过结构相似性网络探究与慢性静脉疾病(CVD)相关的化合物,为相关治疗研究提供数据支持。 文件详解 化合物基础数据文件: Citrus.csv:CSV格式,包含lotus_id、SMILES、DOI、分类学信息等柑橘化合物核心数据...
    packageimg
  • S14_KEMIPFAS高氟物质列表数据集_2019

    2025年12月4日 30 118 34

    数据集概述 该数据集为NORMAN可疑物质清单交换平台中的S14 KEMIPFAS清单,包含高氟物质(PFAS)的结构、市场应用等数据,源自瑞典化学品管理局KEMI报告附录,2019年更新补充CSV文件,支持化学物质信息查询与分析。 文件详解 结构数据文件:...
    packageimg
  • 帕氏前沟藻可疑代谢物列表

    2025年12月4日 30 166 45

    数据集概述 该数据集包含定鞭藻帕氏前沟藻的可疑代谢物列表及基于ChemONT本体的化学分类旭日图,核心代谢物超类包括有机酸及衍生物、脂质及类脂分子等四类,占比合计约百分之九十。 文件详解 文件名称: insection_sl_pp_sunburst.html 文件格式: HTML 内容说明:...
    packageimg
  • 药物分子活性预测数据集

    2025年8月1日 60 12 3

    药物分子活性预测数据集_Drug_Molecule_Activity_Prediction_Dataset 数据来源:互联网公开数据 标签:药物研发, 分子结构, 机器学习, 活性预测, 化学信息学, 分子模拟, 数据挖掘, SMILES 数据概述: 该数据集包含用于预测药物分子活性的结构化数据,主要用于药物研发领域的模型训练与评估。主要特征如下:...
    packageimg
  • 分子性质预测QM9数据集

    2025年10月19日 30 15 7

    分子性质预测QM9数据集_Molecular_Property_Prediction_QM9_Dataset 数据来源:互联网公开数据 标签:分子结构, 量子化学, 机器学习, 分子性质, SMILES, 数据集, 建模, 预测 数据概述: 该数据集包含QM9数据集的子集,记录了基于量子化学计算得到的分子结构及性质数据。主要特征如下:...
    packageimg