数据集概述
本数据集包含SMTRI及其他三种模型(XGBoost、NB、RFSMMA)的性能对比文档、训练测试集数据、模型文件及RNA motif与小分子相互作用数据,涉及RNALigands特性、训练测试集特征及模型文件等13个文件,支持RNA motif靶向小分子预测相关研究。
文件详解
- 文档类文件
- 文件名称:Predictions.docx
- 文件格式:DOCX
- 字段映射介绍:记录SMTRI、XGBoost、NB、RFSMMA四种模型的性能对比内容
- 数据类文件
- 文件名称:SM_Properties.csv
- 文件格式:CSV
- 字段映射介绍:包含motif、SMILES、exactmw、amw、lipinskiHBA、lipinskiHBD、NumRotatableBonds等RNA motif靶向小分子的特性字段
- 文件名称:RNALigands_training_set.csv
- 文件格式:CSV
- 字段映射介绍:带特征的训练集数据
- 文件名称:PDB_testing_set.csv
- 文件格式:CSV
- 字段映射介绍:带特征的PDB测试集数据
- 文件名称:PubChem_testing_set.csv
- 文件格式:CSV
- 字段映射介绍:带特征的PubChem测试集数据
- 文件名称:RPocket_testing_set.csv
- 文件格式:CSV
- 字段映射介绍:包含ae_0至ae_34等特征的RPocket测试集数据
- 文件名称:PDB.csv
- 文件格式:CSV
- 字段映射介绍:PDB来源的RNA motif与小分子相互作用数据
- 文件名称:PubChem.csv
- 文件格式:CSV
- 字段映射介绍:PubChem来源的RNA motif与小分子相互作用数据
- 文件名称:RPocket.csv
- 文件格式:CSV
- 字段映射介绍:RPocket来源的RNA motif与小分子相互作用数据
- 模型类文件
- 文件名称:XGBoost.joblib
- 文件格式:JOBLIB
- 字段映射介绍:XGBoost的最佳保存模型
- 文件名称:NB.joblib
- 文件格式:JOBLIB
- 字段映射介绍:NB的最佳保存模型
- 文件名称:RFSMMA.joblib
- 文件格式:JOBLIB
- 字段映射介绍:RFSMMA的最佳保存模型
- 文件名称:best_DNN_model.h5
- 文件格式:H5
- 字段映射介绍:SMTRI的最佳保存模型
适用场景
- 生物信息学模型性能评估: 对比SMTRI与XGBoost、NB、RFSMMA模型在RNA motif靶向小分子预测任务中的性能
- 药物研发辅助: 利用RNA motif与小分子相互作用数据及模型,辅助RNA靶向小分子药物的筛选与设计
- 机器学习模型训练: 使用带特征的训练集和测试集数据,训练或验证RNA motif靶向小分子预测模型
- 小分子特性分析: 通过SM_Properties.csv分析RNA motif靶向小分子的理化特性与结构特征