标题:癌症患者治疗与生存分析数据集
数据内容:
本数据集包含了癌症患者的详细医疗信息,具体包括:患者唯一标识(PatientID)、年龄(Age)、性别(Gender)、种族/民族(Race/Ethnicity)、身体质量指数(BMI)、吸烟状态(SmokingStatus)、家族病史(FamilyHistory)、癌症类型(CancerType)、疾病分期(Stage)、肿瘤大小(TumorSize)、治疗类型(TreatmentType)、治疗反应(TreatmentResponse)、生存月数(SurvivalMonths)、复发情况(Recurrence)以及遗传标记(GeneticMarker)。数据集还记录了患者所在医院的区域信息(HospitalRegion)。
数据来源:
互联网公开数据
数据用途:
该数据集可用于医疗健康、生物医药和人工智能等领域。例如,可以用于分析不同癌症类型的治疗效果、预测患者生存期、研究复发风险因素、评估遗传标记与治疗反应之间的关系,以及探讨地域对治疗结果的影响。
统计信息分析:
- 患者样本量较大(17,686个唯一患者ID),具有较强的统计代表性和多样性。
- 年龄分布较广(73种不同值),覆盖了不同年龄段的患者群体。
- 癌症类型涵盖了6种不同类型,疾病分期(4种)和治疗类型(4种)的分布较为均衡。
- 肿瘤大小(91种值)和BMI(216种值)的多样性和细化程度较高,为研究提供了丰富的维度。
- 复发情况(2种值)和治疗反应(3种值)的二分类或三分类特性,适合进行分类预测建模。
行业分类:
医疗健康, 生物医药, 人工智能, 数据科学, 医疗信息化
标签:癌症, 治疗效果, 生存分析, 肿瘤研究, 医疗数据, 遗传标记, 病例分析, 患者数据, 数据科学, 医疗健康,