数据集概述
本数据集是NORMAN Suspect List Exchange上S33 SOLUTIONSMLOS清单的关联集合,包含SOLUTIONS项目建模所用的6462种化学品信息,提供结构化数据文件和标识符文件,支持化学品建模相关研究与分析。
文件详解
- 文件名称:
SOLUTIONSMLOS_ed.csv
- 文件格式:CSV
- 字段映射介绍:包含字段No、Subset、No_MLOS_List、Toxicity_data_list_T、EC_number、CAS_number、Name、SMILES、Code、InChIKey、Molar_Mass,记录化学品编号、子集、清单编号、毒性数据清单、EC号、CAS号、名称、SMILES结构、代码、InChIKey、摩尔质量等信息。
- 文件名称:
SOLUTIONSMLOS_ed.xlsx
- 文件格式:XLSX
- 字段映射介绍:与CSV文件字段一致,为结构化表格数据,记录化学品详细属性信息。
- 文件名称:
SOLUTIONSMLOS_ed_InChIKeys.txt
- 文件格式:TXT
- 字段映射介绍:包含一系列InChIKey标识符,如VOXZDWNPVJITMN-UHFFFAOYSA-N、UFBJCMHMOXMLKC-UHFFFAOYSA-N等,每行一个InChIKey。
数据来源
NORMAN Suspect List Exchange
适用场景
- 化学品建模研究:用于SOLUTIONS项目中化学品建模相关的数据分析与模型构建。
- 化学品属性分析:基于CAS号、SMILES、摩尔质量等字段,分析化学品的理化特性与结构关联。
- 化学品毒性研究:结合Toxicity_data_list_T字段,探索化学品毒性数据与结构的关系。
- 化学品标识符关联:通过InChIKey文件,实现不同数据源中化学品的匹配与关联分析。