乳腺癌数据集说明
原始数据提供者:
Matjaz Zwitter 和 Milan Soklic(医生)
机构:南斯拉夫卢布尔雅那大学医学中心肿瘤研究所
数据文件
文件名:data/breast-cancer.csv
数据描述
样本数量:286个病例
属性数量:10个属性
缺失值:存在缺失值
分类标签(目标变量)
类别分布(Class Distribution):
无复发事件(no-recurrence-events):201个样本
复发事件(recurrence-events):85个样本
应用场景
医学研究与健康分析:用于乳腺癌复发风险预测和诊断模型的研究。
机器学习与数据挖掘:分类问题建模,开发乳腺癌诊断算法。
公共卫生政策制定:支持乳腺癌筛查与预防策略的制定。
教育与教学:用于数据分析、统计建模与机器学习课程中的实践案例。