数据集概述
本数据集为Tox21毒理学建模研究的配套数据,包含化学物质的描述符、指纹信息、12个毒性靶点标签、结构标准化管道及模型元数据,支持毒理学预测模型的构建与验证,共6个文件。
文件详解
- tox21_desc_p194.csv
- 文件格式:CSV
- 字段映射介绍:包含化学物质SMILES表达式及194个描述符(如MaxEStateIndex、MinEStateIndex、MolWt等)
- tox21_fp_all.csv
- 文件格式:CSV
- 字段映射介绍:包含化学物质SMILES表达式、指纹数据及MACCS数据
- tox21_target_all.csv
- 文件格式:CSV
- 字段映射介绍:包含化学物质SMILES表达式及12个二进制Tox21毒性靶点标签(如SR-HSE、NR-AR、SR-ARE等)
- standardizer_pipeline.xml
- 文件格式:XML
- 字段映射介绍:ChemAxon Standardizer的结构标准化管道配置文件
- tox21_models_metadata.json
- 文件格式:JSON
- 字段映射介绍:模型元数据,包含sklearn超参数、描述符特征列表等信息
- tox21_model_metrics.xlsx
- 文件格式:XLSX
- 字段映射介绍:毒理学模型的性能评估指标数据
数据来源
Tox21挑战数据(https://tripod.nih.gov/tox21/challenge/data.jsp)及相关研究文献
适用场景
- 毒理学预测模型构建: 利用描述符、指纹数据及靶点标签训练化学物质毒性预测模型
- 化学物质毒性分析: 通过12个靶点标签分析化学物质的潜在毒性作用机制
- 化学结构标准化研究: 基于standardizer_pipeline.xml优化化学物质结构预处理流程
- 模型性能评估: 使用tox21_model_metrics.xlsx分析毒理学模型的预测精度与稳定性
- 计算毒理学研究: 整合多源数据开展化学物质毒性的计算模拟与机制解析