TCGA癌症预测用RNA测序数据集-2011至2021年-tianjiechen

TCGA癌症预测用RNA测序数据集-2011至2021年-tianjiechen 数据来源:互联网公开数据 标签:TCGA,RNA测序,癌症预测,机器学习,数据集,基因组学,医学研究,可解释性

数据概述: 本数据集包含从癌症基因组图谱(Cancer Genome Atlas, TCGA)生成的基因组数据 commons 中收集的RNA测序数据。数据集用于论文《通过二值化RNA测序数据实现可解释的机器学习癌症预测方法》(发表于PLOS ONE,doi: 10.1371/journal.pone.0302947)。数据集中的特征“sample_type_id”是标签/目标变量,值为0.0表示患者不是癌症患者,值为1.0表示患者是癌症患者。

数据用途概述: 该数据集适用于癌症预测研究、机器学习模型开发、基因组数据分析等多个场景。研究人员可以利用此数据集开发和评估癌症预测模型;医学研究者可以探究RNA测序数据在癌症诊断中的应用;数据科学家可以利用此数据进行特征选择和模型解释性研究。此外,该数据集也适合用于教育和培训,帮助学习者理解RNA测序技术及其在癌症研究中的重要性。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 04:59 (UTC)
创建于 五月 31, 2025, 04:59 (UTC)