马斯克v2分子活性数据集用于多实例学习-2011-banddaniel

马斯克v2分子活性数据集用于多实例学习-2011-banddaniel 数据来源:互联网公开数据 标签:分子活性,多实例学习,分类,机器学习,科学研究,数据集,化学,生物信息学

数据概述: 本数据集包含用于分子活性二元分类和多实例学习的分子目标活性数据,共有166个特征(标记为f1, f2等)。数据集被划分为10折的训练和测试集,使用者可选择其中的一组训练集和测试集进行研究。目标变量为0(非活性)或1(活性)。

数据集包含了分子名称和对应的活性标签,每个分子可能有多个实例(即多个特征向量)。原始数据来源于西班牙奥维耶多大学多实例多标签学习组网站,数据格式为.arff,通过提供的脚本可转换为.csv格式,便于进一步分析和使用。

数据用途概述: 该数据集适用于机器学习领域中的分类任务,特别是多实例学习的研究与应用。研究人员可以利用此数据集进行模型训练、验证和比较,评估不同算法在分子活性预测中的表现。此外,该数据集也适合用于教育和培训,帮助学生和研究人员理解多实例学习的基本原理和应用场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 28.67 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。