数据集概述
本数据集是NORMAN可疑物清单交换平台(SLE)中的S122列表,包含通过机器学习模型评估的非靶向分析优先级PBT-PFAS化合物信息。数据来源于Han等人2024年发表在《Environmental Pollution》的研究,涵盖化合物分类、结构、来源等内容,共5个文件,支持环境污染物分析。
文件详解
- TXT文件(共3个,格式:TXT)
S122_PBTPFASNTA_DTXSID.txt:包含DTXSID编号列表,如DTXSID001009316等
S122_PBTPFASNTA_InChIKey.txt:推测包含化合物的InChIKey标识符
S122_PBTPFASNTA_notes.txt:推测包含数据集相关说明或补充信息
- 数据文件(共2个)
S122PBTPFASNTA.xlsx(格式:XLSX):推测包含结构化的化合物详细信息
S122PBTPFASNTA.csv(格式:CSV):包含Index、Name、LongName、Category、CASRN、DTXSID、PubChem_CID、InChIKey、SMILES、Molecular_Formula、Concentration等字段的化合物属性数据
数据来源
NORMAN Suspect List Exchange(SLE)平台、论文“Identifying priority PBT-like compounds from emerging PFAS by nontargeted analysis and machine learning models”(Environmental Pollution, 2024)
适用场景
- 环境污染物优先级评估:分析PBT-PFAS化合物的环境风险优先级,支持污染管控决策
- 化学品结构与属性研究:利用SMILES、InChIKey等字段分析化合物结构与PBT特性的关联
- 环境监测数据整合:通过CASRN、DTXSID等标识符关联其他环境监测数据库
- 机器学习模型验证:基于化合物PBT属性评估结果,验证环境污染物风险预测模型的准确性