乳腺癌肿瘤诊断特征数据集
数据来源:互联网公开数据
标签:乳腺癌,肿瘤,诊断,医学,特征,机器学习,疾病,健康
数据概述:
本数据集包含569个乳腺癌肿瘤的诊断特征,用于预测肿瘤是恶性(Malignant)还是良性(Benign)。 数据集包含了从细胞核图像计算得到的30个特征,这些特征描述了肿瘤的形态学特性。每个特征都包括均值、标准误差和“最坏情况”(即三个最大值的平均值)。例如,字段3代表半径的均值,字段13代表半径的标准误差,字段23代表“最坏”半径。 具体特征包括:
半径(radius):从中心到周边点的平均距离
纹理(texture):灰度值的标准差
周长(perimeter):肿瘤的周长
面积(area):肿瘤的面积
平滑度(smoothness):半径长度的局部变化
紧凑度(compactness):(周长^2)/ 面积 - 1.0
凹陷度(concavity):轮廓凹陷部分的严重程度
凹点(concave points):轮廓凹陷部分的数量
对称性(symmetry):肿瘤的对称性
分形维数(fractal dimension):"海岸线近似值" - 1
诊断结果(Diagnosis):患者是否患有癌症('Malignant','Benign')
数据用途概述:
该数据集主要用于乳腺癌的诊断和预测模型构建,适用于机器学习、数据挖掘等领域。 研究人员可以使用此数据来训练和评估分类模型,以预测肿瘤是恶性还是良性。 此外,该数据集也可用于探索不同特征与诊断结果之间的关系,进行特征重要性分析,从而帮助医生更好地理解肿瘤的特性,辅助临床决策。 还可以用于教育目的,例如在统计学、机器学习课程中作为案例研究使用。