数据集概述
本数据集为S89 PRORISKPFAS清单,包含从NORMAN SusDat整合的4777种PFAS化合物信息,由S9、S14、S25、S46、S80等SLE清单合并并补充SusDat中含氟内容生成。数据提供CID和DTXSID映射,版本v0.1.2修正了部分化合物结构错误,共含5个文件,用于PFAS相关的目标与疑似物筛查研究。
文件详解
- 文件名称:PRORISKPFAS.csv
- 文件格式:CSV
- 字段映射介绍:包含Norman_SusDat_ID(唯一标识)、Name(化合物名称)、CAS(CAS编号)、SMILES_original(原始结构表达式)、SMILES_MS_ready(质谱适用结构表达式)、Monoisotopic_mass(单同位素质量)、Formula(分子式)、StdInChI(标准国际化合物标识)、StdInChIKey(标准国际化合物标识键)、PubChem_CID(PubChem化合物ID)、DTXSID(毒性数据库ID)等字段。
- 文件名称:PRORISKPFAS_InChIKeys.txt
- 文件格式:TXT
- 字段映射介绍:包含化合物的标准国际化合物标识键(StdInChIKey)列表,如AAEJJSZYNKXKSW-UHFFFAOYSA-N等。
- 文件名称:Notes.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集相关说明,如版本更新记录(v0.1.2修正NS00111947的CID)等。
- 文件名称:PRORISKPFAS_DTXSIDs.txt
- 文件格式:TXT
- 字段映射介绍:包含化合物的DTXSID(毒性数据库ID)信息。
- 文件名称:PRORISKPFAS.xlsx
- 文件格式:XLSX
- 字段映射介绍:推测为CSV文件的表格格式版本,包含与CSV文件一致的PFAS化合物详细信息。
数据来源
NORMAN Network Suspect List Exchange(https://www.norman-network.com/nds/SLE/)
适用场景
- 环境样品PFAS筛查: 用于废水、河水、地下水及生物样品中PFAS的目标与疑似物筛查分析。
- 化合物结构与标识映射: 利用CID、DTXSID、InChIKey等字段关联不同数据库的PFAS化合物信息。
- 环境化学研究: 分析PFAS化合物的结构特征、理化性质及其在环境介质中的分布。
- 文献研究数据支持: 为多瑙河流域PFAS监测相关的手稿撰写提供基础数据。