数据集概述
本数据集包含Arena程序相关的基准测试数据,用于评估RNA结构重建程序的性能。数据集分为五个压缩文件,涵盖Arena源代码、基准测试用数据集、RNA核苷酸序列、PDB ID列表及RNA分类文件,为RNA结构重建研究提供标准化测试资源。
文件详解
- Arena-main.zip
- 文件格式:ZIP
- 内容介绍:包含Arena程序的源代码,该代码也可在GitHub获取
- benchmarking_datasets.zip
- 文件格式:ZIP
- 内容介绍:包含Arena及其他RNA重建程序的基准测试数据集,含pdb(原始文件)、pdb_input(补充缺失原子的文件)、pdb_input_C3_prime(仅含C3'原子的文件)、pdb_input_glycoN(仅含糖苷N1/N9原子的文件)、pdb_input_P(仅含P原子的文件)、pdb_input_P_C1_base(仅含P、C1'和碱基原子的文件)、pdb_input_P_ribose(仅含骨架原子的文件)、NAST(NAST结构预测文件)、SimRNA(SimRNA结构预测文件)
- fasta.zip
- 文件格式:ZIP
- 内容介绍:包含基准测试数据集中RNA的核苷酸序列,是Rosetta rna_thread的必需输入
- lists.zip
- 文件格式:ZIP
- 内容介绍:包含用于基准测试的PDB ID文本文件
- RNA_classes.zip
- 文件格式:ZIP
- 内容介绍:包含按RNA类型划分的基准测试数据集tsv文件
适用场景
- RNA结构重建程序性能评估: 用于测试和比较Arena及其他RNA重建程序的准确性和速度
- RNA结构建模研究: 提供不同原子层级的RNA结构文件,支持RNA结构建模方法的开发
- 生物信息学工具开发: 作为标准化测试数据,助力RNA结构分析相关工具的研发与优化
- 计算生物学研究: 为RNA结构预测算法的验证提供基准数据集