数据集概述
本数据集是Lee et al.开展的血压遗传力研究的补充数据,包含六个数据文件,涵盖基因表达列表、MACS2峰值文件、S-LDSC结果、gkmQC结果、gkm-SVM训练数据及功能预测基因列表等内容,用于支持血压遗传力相关的分析与验证。
文件详解
- Data S1:
- 文件名称:Data_S1.tar.gz
- 文件格式:.tar.gz
- 字段映射介绍:包含四种血压相关组织中前5000、6000、7000、8000、9000和10000个表达基因的列表及其hg19坐标。
- Data S2:
- 文件名称:Data_S2.tar.gz
- 文件格式:.tar.gz
- 字段映射介绍:所有组织的MACS2峰值文件,采用narrowPeak格式,坐标基于GRCh38。
- Data S3:
- 文件名称:Data_S3.tar.gz
- 文件格式:.tar.gz
- 字段映射介绍:包含S-LDSC分析的结果文件。
- Data S4:
- 文件名称:Data_S4.tar.gz
- 文件格式:.tar.gz
- 字段映射介绍:所有染色质可及性峰值集的gkmQC结果,包括血压相关和非相关组织。
- Data S5:
- 文件名称:Data_S5.tar.gz
- 文件格式:.tar.gz
- 字段映射介绍:gkm-SVM的训练区域(阳性和阴性集)、最终训练模型、deltaSVM阳性变体及血压相关组织的基序富集分析结果。
- Data S6:
- 文件名称:Data_S6.xlsx
- 文件格式:.xlsx
- 字段映射介绍:预测在特定组织中发挥血压相关功能的基因列表。
数据来源
Lee et al.的血压遗传力研究
适用场景
- 血压遗传力分析:利用S-LDSC结果等数据研究血压的遗传力贡献。
- 基因表达研究:通过Data S1分析血压相关组织中的基因表达特征。
- 染色质可及性分析:基于Data S2和Data S4研究染色质可及性与血压的关联。
- 机器学习模型验证:使用Data S5评估gkm-SVM模型在血压相关功能预测中的性能。
- 功能基因筛选:通过Data S6识别特定组织中与血压相关的功能基因。