决策树模型训练时长预测元数据集

决策树模型训练时长预测元数据集

数据来源:互联网公开数据

标签:元学习,决策树,算法配置,模型训练时长,特征工程,预测,机器学习,Sklearn,Meta-Feature

数据概述:
本数据集是一个元数据集,旨在预测在不同算法配置下,使用Scikit-learn(Sklearn)库构建的决策树模型的训练时长。数据集基于pymfe(Python Meta-Feature Extractor)工具包提取的元特征生成,涵盖了影响决策树模型训练时长的各种因素。数据集中包含多个元特征(Meta-Features),用于描述数据集本身的特性,如属性数量、样本数量、类不平衡程度等,同时记录了决策树模型在不同配置下的实际训练时长。

数据用途概述:
该数据集适用于以下场景:
1. 算法配置优化:研究人员可以利用此数据集预测不同配置下的模型训练时长,从而选择最优的算法参数,提高模型构建效率。
2. 元学习研究:数据集可用于元学习研究,帮助探索数据集特性与模型训练时长之间的关系,为元学习算法提供训练数据。
3. 性能分析与预测:企业或研究机构可以基于此数据集开发预测模型,快速估算新数据集在特定算法配置下的训练成本,支持决策支持系统。
4. 教育与教学:数据集可用于机器学习和元学习领域的教学,帮助学习者理解元特征在模型选择和优化中的作用。

此数据集为元学习和机器学习领域提供了宝贵的基础资源,尤其适用于关注算法效率和训练成本的研究和应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.47 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。