肺癌风险评估数据集基于临床特征的综合分析

标题:肺癌风险评估数据集基于临床特征的综合分析

数据内容: 该数据集包含与肺癌诊断和风险评估相关的临床特征数据。数据集中的字段包括患者的唯一标识符(id)、诊断结果(diagnosis)、肿瘤的几何特征(如半径、周长、面积等)、纹理特征、形态特征(如凹陷、凹点、对称性等)、分形维度特征、标准差特征(se)以及最差特征(worst)等。此外,数据集还包括患者的性别(GENDER)、年龄(AGE)、吸烟史(SMOKING)、手指发黄(YELLOW_FINGERS)、焦虑(ANXIETY)、同伴压力(PEER_PRESSURE)、慢性疾病(CHRONIC DISEASE)、疲劳(FATIGUE)、过敏(ALLERGY)、哮鸣音(WHEEZING)、酒精消费(ALCOHOL CONSUMING)、咳嗽(COUGHING)、气短(SHORTNESS OF BREATH)、吞咽困难(SWALLOWING DIFFICulty)、胸痛(CHEST PAIN)以及肺癌诊断结果(LUNG_CANCER)等信息。

数据来源: 互联网公开数据

数据用途: 该数据集可用于医疗健康行业中的肺癌风险评估、诊断分类模型构建、患者特征分析等研究。此外,数据集也可用于公共卫生领域中的疾病预防策略制定、健康风险因素分析,以及保险行业的健康风险评估和核保模型开发。

标签:肺癌, 风险评估, 临床特征, 诊断分类, 数据分析, 健康管理, 医疗健康, 公共卫生, 保险核保, 机器学习,

行业分类: 医疗健康, 公共卫生, 保险

统计信息分析: 1. 数据集包含569个唯一标识符(id),表明样本量适中。 2. 诊断结果(diagnosis)仅有2种不同值,可能是二分类问题(如良性或恶性)。 3. 几何特征(如radius_mean、perimeter_mean等)具有较高的多样性,表明数据在这些特征上的分布较为广泛。 4. 纹理特征(texture_mean、texture_se等)和形态特征(concavity_mean、concave_points_mean等)也表现出较高的多样性,说明数据在这些方面的区分度较高。 5. 年龄(AGE)有39种不同值,表明数据覆盖了较广的年龄范围。 6. 生活方式特征(如SMOKING、ALCOHOL CONSUMING等)均为二分类变量,可能用于分析这些因素对肺癌风险的影响。 7. 症状特征(如COUGHING、CHEST PAIN等)均为二分类变量,可能用于研究症状与肺癌诊断之间的关系。 8. 数据集中包含多种标准化特征(se)和最差特征(worst),表明数据集设计较为全面,能够从多个角度反映肿瘤的特征。

数据与资源

附加信息

字段
版本 1
最后更新 四月 23, 2025, 16:23 (UTC)
创建于 四月 23, 2025, 16:23 (UTC)