数据集概述
本数据集包含27个胶质母细胞瘤(GBM)样本的RNA-seq数据及相关蛋白质组学数据,用于训练XGBoost模型。数据源自论文“Topographic mapping of the glioblastoma proteome reveals a triple axis model of intra-tumoral heterogeneity”,包含样本信息、蛋白质组学LFQ数据和基因表达TPM数据三类文件,支持生物信息学模型训练与肿瘤异质性研究。
文件详解
- GBM_GLORY_sample_info.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含27个GBM样本的基本信息,用于关联样本与实验数据
- GBM_GLORY_PROTEOMICS_LFQ.txt
- 文件格式:TXT
- 字段映射介绍:包含基因名称及对应GBM样本(如GBM_1012、GBM_1017等)的蛋白质组学LFQ定量数据
- GLORY_20170922.genes_all_samples_TPM.txt
- 文件格式:TXT
- 字段映射介绍:包含基因名称及对应所有GBM样本的转录组TPM表达量数据
数据来源
论文“Topographic mapping of the glioblastoma proteome reveals a triple axis model of intra-tumoral heterogeneity”(Lam KHB等,under review)
适用场景
- XGBoost模型训练: 用于构建胶质母细胞瘤相关的生物信息学预测模型
- 肿瘤异质性研究: 分析GBM样本的转录组与蛋白质组学数据,探索肿瘤内异质性特征
- 基因表达分析: 基于TPM数据研究GBM样本中基因的表达模式与差异
- 蛋白质组学关联分析: 结合LFQ数据开展转录组与蛋白质组的多组学整合研究