乳腺癌细胞图像特征数据集-细胞核特征-诊断-未知时间
数据来源:互联网公开数据
标签:乳腺癌,细胞核,图像分析,诊断,肿瘤,医学,特征提取,机器学习
数据概述:
本数据集包含从乳腺肿块细针穿刺(FNA)数字化图像中提取的细胞核特征。数据集描述了图像中细胞核的各种特性,这些特征用于辅助乳腺癌的诊断。数据集包含569个样本,每个样本有30个特征。
数据集的特征包括:
1. ID号
2. 诊断结果(M = 恶性,B = 良性)
3. 半径(细胞核周长上点到中心点的平均距离)
4. 纹理(灰度值的标准差)
5. 周长
6. 面积
7. 平滑度(半径长度的局部变化)
8. 紧凑度(周长^2 / 面积 - 1.0)
9. 凹陷度(轮廓凹陷部分的严重程度)
10. 凹点(轮廓凹陷部分的数量)
11. 对称性
12. 分形维数(“海岸线近似” - 1)
对于每个细胞核,计算了以上十个特征的均值、标准误差和“最差”(或最大,即三个最大值的均值)。例如,字段3是平均半径,字段13是半径标准误差,字段23是最差半径。所有特征值均以四位有效数字记录。
数据集中没有缺失值,类别分布如下:良性357个,恶性212个。
数据用途概述:
该数据集广泛应用于乳腺癌诊断辅助、肿瘤分类、机器学习模型训练和评估等领域。研究人员可以使用该数据探索细胞核特征与乳腺癌诊断之间的关系,开发和评估用于诊断的机器学习模型。该数据集也适用于教育和培训,帮助学习者理解图像分析和机器学习在医学领域的应用。