自定义树分裂准则测试数据集

数据集概述

本数据集包含十八个用于测试自定义树分裂准则的文件,以CSV格式为主,辅以压缩文件。涵盖人工生成数据集、经典公开数据集及医学相关数据集,可用于算法性能评估与验证。

文件详解

  • 文件名称: 数据集包含多种命名模式的文件,如编号数据集(dataset_18.csv、dataset_37.csv等)、语义关键词数据集(breast+cancer+wisconsin+original.zip、iris.zip等)及人工生成数据集(N_1000_Features_10_Classes_4_Informative_5.csv等)
  • 文件格式: 以.csv格式为主(12个文件),包含.zip压缩文件(6个文件)
  • 文件内容:
  • CSV文件示例(dataset_44087.csv): 包含V1至V5特征列及Class标签列
  • CSV文件示例(dataset_18.csv): 包含att1至att6特征列及class标签列
  • ZIP文件: 包含经典公开数据集压缩包,如breast+cancer+wisconsin+original.zip、iris.zip等

适用场景

  • 机器学习算法测试: 用于验证自定义树分裂准则在分类任务中的性能
  • 算法比较研究: 对比不同树分裂策略在各类数据集上的效果
  • 数据挖掘实验: 支持分类算法的基准测试与性能评估
  • 教育与教学: 可作为机器学习课程中树模型分裂准则的实践案例数据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.62 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。