数据集概述
本数据集包含小鼠乳腺上皮细胞群体的简化代表性亚硫酸氢盐测序(RRBS)甲基化谱与RNA-seq表达谱,以及用于差异甲基化分析的R代码,支持F1000Research发表的相关研究文章。
文件详解
该数据集包含11个文件,具体说明如下:
- 甲基化测序数据文件(.gz格式):
- P6_1.bismark.cov.gz、P6_4.bismark.cov.gz、P7_2.bismark.cov.gz、P7_5.bismark.cov.gz、P8_3.bismark.cov.gz、P8_6.bismark.cov.gz:共6个.gz压缩文件,为不同样本的Bismark覆盖度数据。
- 样本信息文件:
- targets.txt(.txt格式):包含样本与群体对应信息,字段示例:Sample(样本名)、Population(群体)、Description(描述)。
- 差异分析结果文件:
- BvsL-fc3.csv(.csv格式):差异分析结果表,字段示例:GeneID(基因ID)、Length(长度)、Symbol(基因符号)、logFC(对数倍数变化)、PValue(P值)、FDR(校正后P值)。
- 表达谱数据文件:
- rna.RData(.rdata格式):乳腺上皮细胞群体的RNA-seq表达谱数据。
- 分析代码文件:
- Analysis.R(.r格式):执行差异甲基化分析的R代码,展示甲基化与表达差异的负相关性。
- 其他文件:
- index.html(.html格式):可能为数据集索引页面;无具体字段说明。
数据来源
F1000Research发表的文章《Differential methylation analysis of reduced representation bisulfite sequencing experiments using edgeR》
适用场景
- 表观遗传学研究:分析乳腺上皮细胞群体的DNA甲基化差异
- 转录组关联分析:探究甲基化水平与基因表达的相关性
- 生物信息学方法验证:复现或扩展edgeR在RRBS数据差异分析中的应用
- 乳腺发育机制研究:通过甲基化与表达数据解析细胞群体特性