美国各州癌症统计数据集-nancyalaswad90

美国各州癌症统计数据集-nancyalaswad90 数据来源:互联网公开数据 标签:癌症,统计,美国,基因表达,乳腺癌,生存率,数据集,教育,研究

数据概述: 本数据集收录了美国各州关于癌症的统计信息,重点关注乳腺癌患者的基因表达数据。数据集包含272名乳腺癌患者的基因表达数据,基因特征共有1570个指标。此外,数据集中还包含了患者的个人信息、治疗方案和生存情况等元数据。

数据集中的每个节点代表一个具有相似基因表达模式的患者群体。通过可视化分析,可以识别出不同的亚群体。例如,底部的flare代表100%生存的患者群体,而顶部的flare则显示了生存率从极差到极好的范围,其中底部被圈出的部分是具有高生存率的亚组,尽管他们具有通常预示较差预后的基因指标(如低ESR1水平)。这种现象可能对提高乳腺癌患者的生存率具有重要意义。

数据集是从https://query.data.world/s/yi422lv7mkhnydnt4ixrfujmoaglpk获取的,并且遵循CC BY 4.0许可协议。

数据用途概述: 该数据集适用于癌症研究、基因表达分析、生存率预测等场景。研究人员和学生可以利用此数据集进行数据分析练习,包括监督学习和非监督学习方法的对比分析。教育者可以使用此数据集作为教学资源,帮助学生理解和应用复杂的统计与生物信息学概念。此外,数据集还适用于医学教育和研究,为癌症治疗和预后研究提供数据支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.09 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。