数据集概述
本数据集为TB-Drugome工作流的第126次运行记录,包含结构生物学与计算化学方法用于结核病药物靶点预测的完整输入输出文件。数据涵盖结核分枝杆菌蛋白质结构信息、药物结合位点列表、药物关键参数及工作流配置属性,支持药物重定位与蛋白质-配体相互作用分析。数据集共包含13个文件,覆盖文本、表格、图像及压缩包等多种格式。
文件详解
- 输入文件(IN目录)
- 文件名称:
tb_protein_info.csv, drug_key.csv, template_pdbs.csv, drug_binding_sites_list.csv
- 文件格式:CSV
- 字段映射介绍:包含结核病蛋白质基本信息、药物名称缩写映射、模板PDB结构列表及药物结合位点标识符。
- 文件名称:
model_info_updated.txt, smap_properties.txt, homology_models_list_txt.txt, solved_tb_structures_list_txt.txt
- 文件格式:TXT
- 字段映射介绍:记录模型参数、SMAP算法属性(如原子半径、结构匹配规则)、同源模型列表及已解析结核病结构清单。
- 文件名称:
run_126_worflow.png
- 文件格式:PNG
- 字段映射介绍:工作流运行过程的可视化示意图。
- 文件名称:
MtbStructures_tar_gz.gz
- 文件格式:GZ
- 字段映射介绍:结核分枝杆菌结构数据的压缩归档文件。
- 输出文件(OUT目录)
- 文件名称:
c02338550daf54951c1e6a55e55b16c2.txt
- 文件格式:TXT
- 字段映射介绍:工作流运行结果的哈希命名文本文件,内容为计算生成的药物-靶点相互作用数据。
适用场景
- 药物重定位研究:基于结核病蛋白质结构数据,预测现有药物与新靶点的相互作用,支持老药新用策略。
- 蛋白质-配体对接分析:利用SMAP属性及结合位点信息,优化分子对接模拟的参数配置与结果验证。
- 结核病靶点机制探索:通过同源模型与已解析结构对比,分析结核分枝杆菌关键蛋白的功能域与药物结合特性。
- 计算生物学工作流验证:作为TB-Drugome工作流的典型运行实例,用于方法重复性测试与算法性能评估。