数据集概述
本数据集为论文“基于变分自动编码器的无监督深度学习框架在乳腺癌全基因组DNA甲基化分析与生物特征提取中的应用”的补充数据,包含二十二个CSV文件和一个DOCX文件,记录了DNA甲基化分析相关的基因本体(GO)术语、统计指标等信息,可用于乳腺癌表观遗传学特征研究。
文件详解
- 数据文件(CSV格式,共二十二个)
- 文件名称示例:SupData11.csv、SupData13.csv、SupData21.csv等
- 文件格式:CSV
- 字段映射介绍:以SupData11.csv为例,包含字段有Term(术语,如GO:0044422)、Ont(本体类别,如CC)、N(总数)、DE(差异表达数)、P.DE(差异表达P值)、FDR(校正后P值)
- 文档文件(DOCX格式,共一个)
- 文件名称:SupplementalFigures.docx
- 文件格式:DOCX
- 内容说明:包含论文相关的补充图表
数据来源
论文“An unsupervised deep learning framework with variational autoencoders for genome-wide DNA methylation analysis and biologic feature extraction applied to breast cancer”
适用场景
- 乳腺癌表观遗传学研究:分析全基因组DNA甲基化数据,挖掘乳腺癌相关的表观遗传特征
- 深度学习模型验证:验证变分自动编码器在生物特征提取中的性能
- 基因本体功能分析:通过GO术语及统计指标,研究差异甲基化相关的细胞组分、分子功能等
- 生物标志物筛选:基于DNA甲基化数据筛选乳腺癌潜在的诊断或预后生物标志物