数据集概述
本数据集包含针对细菌、病毒、寄生虫和真菌等病原体的抗菌肽数据库,通过PubChem和ChEMBL获取肽的SMILES结构,经OpenBabel转换为一维SMI、三维MOL2和PDB格式,共七百一十八条具有抑制活性的肽,支持病原体分子靶点相关研究。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 补充资料文件:
- Database supplementary material.xlsx: Excel格式文件,可能包含数据集的补充说明信息。
- 分类肽文件目录:
按肽的类型分为Antibacterial peptides(抗菌肽)、Antifungal peptides(抗真菌肽)、Antiparasitic peptides(抗寄生虫肽)、Antiviral peptides(抗病毒肽)四个子目录,每个子目录下进一步按文件格式分为mol2、pdb、smi三个子目录:
- mol2目录: 存储.mol2格式的肽结构文件,如cecropin_a_1_33.mol2、gramicidin_d.mol2等。
- pdb目录: 存储.pdb格式的肽结构文件,如cecropin_a.pdb、gramicidin_a.pdb等。
- smi目录: 存储.smi格式的肽结构文件,如cecropin_b1.smi、gallinacin_1alpha.smi等。
- 其他文件:
- Peptides order.txt: TXT格式文件,包含按日期统计的肽数量信息。
- desktop.ini: 配置文件。
适用场景
- 药物研发: 用于新型抗菌、抗病毒、抗真菌、抗寄生虫肽类药物的筛选与设计。
- 分子生物学研究: 分析肽与病原体分子靶点的相互作用机制。
- 结构生物学研究: 基于三维结构文件探究肽的空间构象对其活性的影响。
- 药理学研究: 评估肽对临床重要病原体分子靶点的抑制活性。