高维癌症微阵列基因表达数据集

数据集概述

该数据集包含脑肿瘤(CNS)、弥漫性大B细胞淋巴瘤(DLBCL)、白血病和前列腺癌四种癌症类型的基因表达谱,涵盖癌症与对照组织样本的基因表达水平数据,支持癌症研究、基因发现及计算生物学基准研究。

文件详解

数据集包含4个文件,均位于High-Dimensional Cancer Microarray Gene Expression/目录下: - 脑肿瘤数据文件:BrainTumor_CNS.arff,格式为ARFF,包含脑肿瘤(CNS)的基因表达数据 - 白血病数据文件:Leukemia.csv,格式为CSV,包含白血病的基因表达数据,字段以基因探针ID命名(如AFFX-BioB-5_at) - 弥漫性大B细胞淋巴瘤数据文件:Diffuse large B-cell lymphoma(DLBCL) - Diffuse large B-cell lymphoma(DLBCL).csv,格式为CSV,包含DLBCL的基因表达数据,字段以基因探针ID命名(如A28102_at) - 前列腺癌数据文件:prostate_cancer.csv,格式为CSV,包含前列腺癌的基因表达数据

适用场景

  • 癌症基因研究:识别潜在致癌基因
  • 计算生物学基准测试:验证基因排序、特征选择及分类算法性能
  • 机器学习应用:开发癌症类型分类模型
  • 生物信息学分析:探索基因表达模式与癌症类型的关联
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.79 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。