数据集概述
本数据集为美国州癌症概况(State Cancer Profiles)网站的自动化抓取数据,包含美国所有地区、人口统计学变量及疾病类型的癌症发病率和死亡率信息,提供结构化数据支持,无需用户自行抓取,适用于数据挖掘或构建衍生数据产品。
文件详解
- 癌症发病率数据文件
- 文件名称:state_cancer_profiles_incidence.csv.gz
- 文件格式:CSV.GZ
- 字段映射介绍:包含美国各州癌症发病率相关数据,具体字段可结合select_options.json中的维度(如州FIPS码、区域类型、癌症类型、种族、性别、年龄、分期、年份)进行解析
- 癌症死亡率数据文件
- 文件名称:state_cancer_profiles_mortality.csv.gz
- 文件格式:CSV.GZ
- 字段映射介绍:包含美国各州癌症死亡率相关数据,具体字段可结合select_options.json中的维度(如州FIPS码、区域类型、癌症类型、种族、性别、年龄、分期、年份)进行解析
- 选项配置文件
- 文件名称:select_options.json
- 文件格式:JSON
- 字段映射介绍:包含数据筛选维度的键值对,具体键为stateFIPS(州FIPS码)、areatype(区域类型)、cancer(癌症类型)、race(种族)、sex(性别)、age(年龄)、stage(分期)、year(年份)
数据来源
State Cancer Profiles官网(https://statecancerprofiles.cancer.gov)
适用场景
- 癌症流行病学研究:分析美国各州癌症发病率、死亡率的分布特征及变化趋势
- 公共卫生政策制定:为区域癌症防控策略、资源分配提供数据支持
- 医疗健康数据产品开发:基于结构化数据构建癌症数据可视化工具或预测模型
- 人口健康差异分析:探究不同人口统计学特征(种族、性别、年龄)与癌症发病/死亡风险的关联