数据集

乳腺癌诊断数据集BreastCancerWisconsinDiagnostic-bhaskerpaul

数据来源：互联网公开数据

标签：乳腺癌, 肿瘤诊断, 机器学习, 数据分析, 临床医学, 细胞特征, 特征工程, 二分类

数据概述：该数据集包含来自威斯康星大学医院的乳腺癌诊断数据，记录了乳腺肿瘤的各种细胞特征，用于区分良性（Benign）和恶性（Malignant）肿瘤。主要特征如下：时间跨度：数据未标明具体时间，可视为静态数据集。地理范围：数据来源于威斯康星州医院，但数据本身不包含地理位置信息，可用于全球范围内的乳腺癌研究。数据维度：数据集包含569个样本，每个样本有32个特征，包括肿瘤的ID、诊断结果（M代表恶性，B代表良性），以及30个与细胞核特征相关的数值特征，如半径、纹理、周长、面积、平滑度、紧凑度、凹度、凹点、对称性、分形维度等，以及这10个特征的均值、标准差和最差值。数据格式：CSV格式，文件名为breast cancer wisconsin diagnostic..csv，方便数据分析和建模。数据来源：该数据来源于UCI机器学习数据库，经过了预处理和标准化。该数据集适合用于乳腺癌诊断的预测模型构建、特征重要性分析和医学研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于医学研究和生物信息学领域，用于探索乳腺癌的细胞特征与诊断结果之间的关系，以及评估不同特征的重要性。行业应用：可用于构建乳腺癌诊断辅助系统，帮助医生进行更准确的诊断。决策支持：支持医疗机构的风险评估和患者管理，优化治疗方案。教育和培训：作为机器学习、数据科学和医学课程的实训材料，帮助学生和研究人员学习和实践二分类问题。此数据集特别适合用于探索细胞特征与乳腺癌诊断结果之间的关联，帮助用户构建预测模型，提高诊断准确性。

数据与资源

versions_20250312051728.zipZIP
18.41 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	18.41 MiB
最后更新	2025年5月16日
创建于	2025年5月16日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。