莱什生物训练数据集5折分层

莱什生物训练数据集5折分层

数据来源:互联网公开数据

标签:莱什生物,训练数据,分层交叉验证,多标签分类,生物分子,药物开发,机器学习

数据概述: 本数据集是经过优化处理的莱什生物训练数据集,采用多标签分层交叉验证方法,将数据集划分为5个均衡分布的子集。分层策略基于buildingblocks(构建块)和binds(结合能力)两个核心维度,确保各子集在buildingblocks_1/2/3和binds_BRD4/HS_A/sEH等关键特征上的分布一致性。

数据用途概述: 该数据集主要适用于机器学习模型的训练与评估,特别是在多标签分类和生物分子特性预测领域具有重要应用价值。研究人员可以利用此数据集进行模型性能评估、算法优化以及生物分子特性预测研究。此外,该数据集还为药物开发、生物分子相互作用研究提供了高质量的训练基准。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 123.41 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。