数据集概述
本数据集是neXtProt蛋白激酶功能门户提供的蛋白质功能信息资源,包含蛋白质功能的注释三元组(蛋白质主体、关系描述、功能/定位/属性对象),以及相关的元数据文件,共8个文件,支持生物信息学领域对蛋白质功能的研究与分析。
文件详解
- 文档类文件
- 文件名称:
Caloha_readme.txt.txt、README.txt、LICENSE.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集说明、版权声明(CC BY 4.0协议)、使用指引及联系信息
- 本体类文件
- 文件名称:
caloha.obo、cv_protein_property.obo、cv_modification_effect.obo
- 文件格式:OBO
- 字段映射介绍:定义蛋白质功能注释相关的本体术语,用于标准化注释内容的分类与描述
- 数据类文件
- 文件名称:
protein_kinase_function_portal.json
- 文件格式:JSON
- 字段映射介绍:存储蛋白质功能注释的结构化数据
- 文件名称:
protein_kinase_function_portal.csv.csv
- 文件格式:CSV
- 字段映射介绍:包含蛋白质功能注释的核心字段,如Accession number(登录号)、Protein(蛋白质)、Relation(关系)、Object(对象)、Data confidence(数据置信度)、Evidence codes(证据代码)、Reference(参考文献)、Protein origin(蛋白质来源)等
数据来源
SIB - Swiss Institute of Bioinformatics(瑞士生物信息学研究所)
适用场景
- 蛋白质功能注释研究:利用注释三元组数据,分析蛋白质的功能、亚细胞定位及属性特征
- 生物信息学本体构建:基于OBO文件的本体术语,优化蛋白质功能注释的标准化体系
- 蛋白激酶功能分析:针对激酶类蛋白质的功能关系与实验证据,开展专项生物医学研究
- 实验数据验证:通过CSV文件中的实验系统、细节及置信度信息,验证蛋白质功能的实验依据可靠性