数据集概述
该数据集围绕三阴性与非三阴性乳腺癌诊断展开,包含用于机器学习模型评估的实验数据及SHAP可视化分析的相关资料,为研究乳腺癌诊断模型性能及特征解释提供支持。
文件详解
该数据集包含一个目录及两个文件,具体说明如下:
- 目录: Evaluation of Machine Learning Models and SHAP Visualization on the Diagnosis of Triple Negative and Non-Triple Negative Breast Cancer/
- 文件列表:
- breast_cancer_dataset.csv: CSV格式数据文件,包含乳腺癌诊断相关字段,如年龄(Age)、身高(Height)、体重(Weight)、病灶大小(Size)、临床症状(Clinical_symptoms)、触诊结果(Palpation)、病灶形状(Shape)、纵横比(Aspect_ratio)、边缘特征(Margin)、结构扭曲(Architectural_distortion)、微钙化(Microcalcification)、后方回声(Posterior_echo)、高回声晕(Hyperechoic_halo)、内部血流(Internal_flow)、外周血流(Peripheral_flow)及癌症诊断标签(cancer)
- code.doc: DOC格式文档文件,可能包含机器学习模型评估及SHAP可视化的代码说明或相关文档
适用场景
- 医学诊断模型研究: 评估机器学习模型在乳腺癌亚型诊断中的性能
- 医疗数据可视化分析: 利用SHAP技术解释模型诊断结果的关键特征
- 乳腺癌临床特征研究: 分析临床指标与乳腺癌亚型的关联
- 医疗AI算法优化: 基于数据集改进乳腺癌诊断算法的准确性与可解释性