数据集概述
本数据集包含用于评估ZHMolGraph模型的分子相互作用相关数据,共5个文件,主要记录RNA与蛋白质的序列信息、相互作用关系及相关注释,支持生物信息学模型的性能验证与分析。
文件详解
- NPInter5.xlsx
- 文件格式:XLSX
- 字段映射介绍:推测包含NPInter5数据库中的分子相互作用相关数据(具体字段未提供预览)
- dataset_RPI_RPI7317_RP.csv
- 文件格式:CSV
- 字段映射介绍:包含Type(类型)、Y(标签)、RNA_list(RNA列表)、RNA_aa_code(RNA序列编码)、target_aa_code(目标序列编码)、protein_list(蛋白质列表)等字段
- NPInter5_interactions_seqpairs.csv
- 文件格式:CSV
- 字段映射介绍:包含RNA_aa_code(RNA序列编码)、target_aa_code(目标序列编码)、ncID(ncRNA ID)、ncName(ncRNA名称)、tarID(靶标ID)、tarName(靶标名称)、organism(物种)、RNA names(RNA名称)、Protein names(蛋白质名称)、Y(标签)等字段
- dataset_RPI_NPInter5_RP.csv
- 文件格式:CSV
- 字段映射介绍:推测包含基于NPInter5数据库的RPI(RNA-蛋白质相互作用)相关数据(具体字段未提供预览)
- dataset_RPI_NPInter2_RP.csv
- 文件格式:CSV
- 字段映射介绍:推测包含基于NPInter2数据库的RPI(RNA-蛋白质相互作用)相关数据(具体字段未提供预览)
适用场景
- 生物信息学模型评估: 用于验证ZHMolGraph模型在分子相互作用预测任务中的性能
- 分子相互作用研究: 分析RNA与蛋白质的序列特征及其相互作用关系
- 生物数据库整合分析: 整合NPInter系列数据库数据,开展跨库分子相互作用规律研究
- 序列编码与注释应用: 基于RNA_aa_code、target_aa_code等序列编码字段,探索分子序列与功能的关联