数据集概述
本数据集是iOBPdb初始版本的存档数据,记录昆虫气味结合蛋白(OBP)对挥发性有机化合物(VOC)的结合亲和力信息。包含91种昆虫的382个独特OBP、622种VOC目标及181项功能研究数据,通过结构化文件整合相关生物信息与实验结果。
文件详解
- OBP_info.csv(CSV格式):记录气味结合蛋白信息,字段包括结合蛋白名称、类型、来源、发表日期、引用文献、结合实验方法、结合值单位、物种、氨基酸序列、无信号肽序列、登录号/ID、半胱氨酸信息等。
- Compound_info.csv(CSV格式):记录挥发性有机化合物信息(具体字段未展示,推测包含化合物基本属性)。
- Compound_OBP_binding.csv(CSV格式):记录化合物与OBP的结合数据,字段包括CAS编号、化合物名称及多种OBP(如AaegOBP22、AbamOBP28等)的结合相关信息。
- AlphaFold_Denovo_PDBs.zip(ZIP格式):包含基于AlphaFold预测的OBP从头建模PDB文件压缩包。
数据来源
iOBPdb数据集初始存档版本
适用场景
- 昆虫嗅觉机制研究:分析OBP与VOC的结合特异性,探究昆虫嗅觉识别的分子基础。
- 生物信息学建模:利用结合亲和力数据构建OBP-VOC相互作用预测模型。
- 害虫防控靶点筛选:识别对特定VOC具有高亲和力的OBP,为新型引诱剂或驱避剂开发提供靶点。
- 进化生物学分析:比较不同昆虫物种OBP的序列与结合特性,研究嗅觉系统的进化规律。