乳腺癌细胞图像特征分析数据集
数据来源:互联网公开数据
标签:乳腺癌,医学,肿瘤,诊断,细胞,图像,特征,机器学习,健康
数据概述:
本数据集包含了乳腺癌细胞图像的多种特征,旨在辅助乳腺癌的诊断与研究。数据集核心字段包括:诊断结果(良性或恶性),以及一系列细胞图像特征的均值、标准误差和“最差”情况下的测量值。这些特征涵盖了细胞半径、纹理、周长、平滑度、紧凑度、凹陷度、凹点、分形维度等,共计30个特征。
字段定义如下:
diagnosis:乳腺组织诊断结果(M=恶性,B=良性)
radius_mean:细胞核半径(平均值)
texture_mean:灰度值的标准差(平均值)
perimeter_mean:细胞核周长(平均值)
smoothness_mean:半径长度的局部变化(平均值)
compactness_mean:周长^2 / 面积 - 1.0(平均值)
concavity_mean:轮廓凹陷程度(平均值)
concave points_mean:轮廓凹陷部分的数量(平均值)
fractal_dimension_mean:"海岸线近似" - 1(平均值)
radius_se:细胞核半径的标准误差
texture_se:灰度值标准差的标准误差
smoothness_se:半径长度局部变化的标准误差
compactness_se:周长^2 / 面积 - 1.0的标准误差
concavity_se:轮廓凹陷程度的标准误差
concave points_se:轮廓凹陷部分数量的标准误差
fractal_dimension_se:"海岸线近似" - 1的标准误差
radius_worst:细胞核半径(最差情况,即最大均值)
texture_worst:灰度值标准差(最差情况)
smoothness_worst:半径长度局部变化(最差情况)
compactness_worst:周长^2 / 面积 - 1.0(最差情况)
concavity_worst:轮廓凹陷程度(最差情况)
concave points_worst:轮廓凹陷部分的数量(最差情况)
fractal_dimension_worst:"海岸线近似" - 1(最差情况)
数据用途概述:
该数据集可用于乳腺癌的早期诊断、肿瘤性质分析、机器学习模型训练与评估等。研究人员可利用该数据开发预测模型,辅助医生进行诊断决策;可用于探索不同细胞特征与肿瘤类型的关系;也可用于医学教育,帮助学生理解乳腺癌诊断相关的细胞学指标。