更新版卢布尔雅那乳腺癌数据集_简化清洗版

数据集概述

该数据集是原始卢布尔雅那乳腺癌数据集的简化清洗版本,包含二百五十二个乳腺癌患者样本及六个属性,核心用于机器学习算法预测复发事件,其中包含一个指示复发是否发生的二元类别标签。

文件详解

  • 文件名称: LBCD_rd.arff
  • 文件格式: ARFF (.arff)
  • 内容说明: 包含二百五十二个乳腺癌患者样本数据,涉及六个属性字段,包括一个二元类别标签(指示复发事件是否发生)。属性基于特征重要性筛选自原始数据集的十个属性,主要保留了恶性程度、放疗情况、淋巴结包膜、肿瘤大小、浸润淋巴结等关键特征。

数据来源

UCI Machine Learning Repository

适用场景

  • 医疗机器学习研究: 用于开发和验证预测乳腺癌复发事件的机器学习模型。
  • 特征选择研究: 分析不同特征对乳腺癌复发预测的贡献度与相关性。
  • 数据清洗方法验证: 评估简化清洗流程对原始医疗数据集性能的影响。
  • 医学统计分析: 探索乳腺癌临床特征与复发风险之间的关联。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。