乳腺癌肿瘤诊断特征数据集

乳腺癌肿瘤诊断特征数据集 数据来源:互联网公开数据 标签:乳腺癌,肿瘤,诊断,医学,特征,机器学习,疾病,健康 数据概述: 本数据集包含569个乳腺癌肿瘤的诊断特征,用于预测肿瘤是恶性(Malignant)还是良性(Benign)。 数据集包含了从细胞核图像计算得到的30个特征,这些特征描述了肿瘤的形态学特性。每个特征都包括均值、标准误差和“最坏情况”(即三个最大值的平均值)。例如,字段3代表半径的均值,字段13代表半径的标准误差,字段23代表“最坏”半径。 具体特征包括: 半径(radius):从中心到周边点的平均距离 纹理(texture):灰度值的标准差 周长(perimeter):肿瘤的周长 面积(area):肿瘤的面积 平滑度(smoothness):半径长度的局部变化 紧凑度(compactness):(周长^2)/ 面积 - 1.0 凹陷度(concavity):轮廓凹陷部分的严重程度 凹点(concave points):轮廓凹陷部分的数量 对称性(symmetry):肿瘤的对称性 分形维数(fractal dimension):"海岸线近似值" - 1 诊断结果(Diagnosis):患者是否患有癌症('Malignant','Benign')

数据用途概述: 该数据集主要用于乳腺癌的诊断和预测模型构建,适用于机器学习、数据挖掘等领域。 研究人员可以使用此数据来训练和评估分类模型,以预测肿瘤是恶性还是良性。 此外,该数据集也可用于探索不同特征与诊断结果之间的关系,进行特征重要性分析,从而帮助医生更好地理解肿瘤的特性,辅助临床决策。 还可以用于教育目的,例如在统计学、机器学习课程中作为案例研究使用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.05 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。