乳腺癌诊断数据集-威斯康星州乳腺癌诊断数据集WDBC

乳腺癌诊断数据集-威斯康星州乳腺癌诊断数据集WDBC 数据来源:互联网公开数据 标签:乳腺癌,诊断,肿瘤,医学,机器学习,分类,病理学,生物医学,特征工程 数据概述: 本数据集,即威斯康星州乳腺癌诊断数据集(WDBC),源于威斯康星州医院,旨在通过细胞核特征对乳腺肿瘤进行良性或恶性的分类。数据集包含569个实例,每个实例代表一个乳腺肿瘤的样本。每个样本包含一个ID号、诊断结果(M代表恶性,B代表良性),以及30个细胞核特征。这些特征分为三组:均值、标准误差和“最差”值(即三个最大值的均值),每组包含10个特征。这些特征描述了细胞核的各种属性,如半径、纹理、周长、面积、平滑度、紧凑度、凹陷度、凹点、对称性和分形维度。所有特征值均被编码为四位有效数字。

数据用途概述: 该数据集广泛应用于机器学习和数据挖掘领域,主要用于训练和评估乳腺癌诊断分类模型。研究人员可以利用该数据集进行特征分析、模型构建和性能评估,探索不同机器学习算法在乳腺癌诊断中的应用,例如支持向量机、逻辑回归、决策树等。该数据集也适用于医学研究,用于理解肿瘤的细胞学特征与诊断结果之间的关系。此外,该数据集还可用于教育目的,例如作为机器学习课程的实践案例,帮助学生理解分类问题的解决过程。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.05 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。