乳腺癌细胞图像特征数据集-细胞核特征-诊断-未知时间

乳腺癌细胞图像特征数据集-细胞核特征-诊断-未知时间

数据来源:互联网公开数据

标签:乳腺癌,细胞核,图像分析,诊断,肿瘤,医学,特征提取,机器学习

数据概述: 本数据集包含从乳腺肿块细针穿刺(FNA)数字化图像中提取的细胞核特征。数据集描述了图像中细胞核的各种特性,这些特征用于辅助乳腺癌的诊断。数据集包含569个样本,每个样本有30个特征。

数据集的特征包括: 1. ID号 2. 诊断结果(M = 恶性,B = 良性) 3. 半径(细胞核周长上点到中心点的平均距离) 4. 纹理(灰度值的标准差) 5. 周长 6. 面积 7. 平滑度(半径长度的局部变化) 8. 紧凑度(周长^2 / 面积 - 1.0) 9. 凹陷度(轮廓凹陷部分的严重程度) 10. 凹点(轮廓凹陷部分的数量) 11. 对称性 12. 分形维数(“海岸线近似” - 1)

对于每个细胞核,计算了以上十个特征的均值、标准误差和“最差”(或最大,即三个最大值的均值)。例如,字段3是平均半径,字段13是半径标准误差,字段23是最差半径。所有特征值均以四位有效数字记录。

数据集中没有缺失值,类别分布如下:良性357个,恶性212个。

数据用途概述: 该数据集广泛应用于乳腺癌诊断辅助、肿瘤分类、机器学习模型训练和评估等领域。研究人员可以使用该数据探索细胞核特征与乳腺癌诊断之间的关系,开发和评估用于诊断的机器学习模型。该数据集也适用于教育和培训,帮助学习者理解图像分析和机器学习在医学领域的应用。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 04:44 (UTC)
创建于 四月 15, 2025, 04:44 (UTC)