SIDERITE研究的铁载体多样性数字探索数据集

数据集概述

本数据集包含SIDERITE研究中用于探索化学空间中铁载体多样性的脚本和数据,主要用于生成COCONUT数据库的TMAP可视化图(补充材料图S3),支持铁载体相关的化学结构分析与聚类研究。

文件详解

  • 代码文件:
  • plot_COCONUT.py: Python脚本文件,运行后使用COCONUT.csv生成可交互的TMAP可视化结果(index.html和index.js)
  • 数据文件:
  • COCONUT.csv: CSV格式数据文件,包含铁载体ID、SMILES结构、数据库信息、铁载体分类、分子量等字段
  • Tanimoto_COCONUT_SIDERITE.xlsx: Excel文件,用于聚类分析的输入数据
  • Sid_structure_output3.xlsx: Excel文件,用于铁载体结构处理和统计分析的输入数据
  • COCONUT4MetFrag_Canonical.xlsx: Excel文件,用于TMAP分析的输入数据
  • COCONUT_r.txt: 文本文件,TMAP分析的输出数据和铁载体预测的输入数据
  • COCONUT4MetFrag.xlsx: Excel文件,用于SMILES结构检查的输入数据
  • 输出文件:
  • index.html: HTML格式文件,TMAP可视化结果页面
  • index.js: JavaScript格式文件,TMAP可视化结果的脚本文件

数据来源

RuolinHe/SIDERITE GitHub仓库

适用场景

  • 铁载体化学结构分析: 探索化学空间中铁载体的结构多样性与分布特征
  • 化学信息学研究: 支持基于TMAP的化学结构聚类与可视化分析
  • 铁载体预测模型开发: 为铁载体预测算法提供训练和验证数据
  • 天然产物化学研究: 辅助识别潜在的新型铁载体化合物
  • 生物信息学分析: 结合铁载体结构数据开展生物合成途径研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 365.68 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。