乳腺癌细胞诊断数据集-威斯康星州-1988

乳腺癌细胞诊断数据集-威斯康星州-1988 数据来源:互联网公开数据 标签:乳腺癌,诊断,细胞,医学,机器学习,肿瘤,疾病,健康,临床数据

数据概述: 本数据集源自对乳腺肿块细针穿刺(FNA)图像的数字化分析,包含了对细胞核特征的详细描述。数据集共包含569个观测样本,每个样本均有32个属性。这些属性包括细胞核的ID号、诊断结果(恶性或良性),以及从细胞核图像中计算出的十个实数值特征。

这些特征包括:

半径(细胞核周边点到中心的平均距离) 纹理(灰度值的标准差) 周长 面积 平滑度(半径长度的局部变化) 紧凑度(周长^2 / 面积 - 1.0) 凹陷度(轮廓凹陷部分的严重程度) 凹点数(轮廓凹陷部分的数量) 对称性 分形维度(“海岸线近似” - 1)

数据由威斯康星大学的William H. Wolberg博士、W. Nick Street和Olvi L. Mangasarian创建并提供,发布于1988年。

数据用途概述: 该数据集广泛应用于乳腺癌的诊断和预测模型构建、机器学习算法的评估与比较、以及医学影像分析等领域。研究人员可以使用此数据训练和测试分类模型,以预测乳腺肿瘤的良恶性,从而辅助临床医生进行诊断。此外,该数据集也常被用于教学和研究,帮助学习者理解机器学习在医学领域的应用,并探索特征选择和模型优化的方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.05 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。