数据集概述
本数据集为AANRI手稿的源数据与补充数据,包含神经典型非裔美国人死后大脑基因表达分析相关的20个文件,涉及表型数据、基因表达预测、功能富集分析、eQTL分析等内容,用于揭示遗传 ancestry对基因表达的影响。
文件详解
- 表型数据文件
- 文件名称:merged_phenotypes.csv
- 文件格式:CSV
- 字段映射介绍:包含BrNum(大脑编号)、RNum(样本编号)、Region(脑区)、RIN(RNA完整性数值)、Age(年龄)、Sex(性别)、Race(种族)、Dx(诊断结果)、mitoRate(线粒体基因比例)等表型信息
- 基因表达与遗传分析文件
- 文件名称:BrainSeq_est_prop_Bisque.Rdata、BrainSeq_ancestry_dependent_eQTL_4features_4regions_significant.txt.gz、BrainSeq_ancestry_local_4features_4regions_allFeatures.txt.gz等
- 文件格式:RData、.txt.gz
- 字段映射介绍:包含遗传血统比例估计、血统依赖型eQTL分析结果、局部血统分析结果等遗传与基因表达关联数据
- 功能富集分析文件
- 文件名称:DE_functional_enrichment_ancestry_AAonly.xlsx、WGCNA_functional_enrichment_analysis_ancestry_AAonly.xlsx、DMR_functional_enrichment_localAncestry_AAonly.xlsx等
- 文件格式:XLSX
- 字段映射介绍:包含差异表达基因、共表达模块、差异甲基化区域的功能富集分析结果,涉及生物学通路、基因本体等注释信息
- 压缩归档文件
- 文件名称:predicted_expression.tar.gz、dmr_results.tar.gz
- 文件格式:.tar.gz
- 字段映射介绍:分别包含预测基因表达数据和差异甲基化区域分析结果的压缩包
- 其他分析结果文件
- 文件名称:partial_r2_de_summary.tsv、mashr_meta_results.RData等
- 文件格式:TSV、RData
- 字段映射介绍:包含差异表达基因的部分R²统计结果、meta分析结果等
数据来源
AANRI manuscript
适用场景
- 神经科学研究:分析神经典型非裔美国人死后大脑基因表达特征及其与遗传血统的关联
- 遗传学研究:探究遗传血统对基因表达、eQTL、DNA甲基化的影响机制
- 生物信息学分析:利用功能富集结果研究差异表达基因的生物学功能与通路
- 医学研究:为神经精神疾病的遗传机制研究提供参考数据
- 数据整合分析:整合表型、基因表达、遗传血统数据开展多组学关联分析