数据集概述
本数据集为论文“Re-evaluation and Re-analysis of 152 research exomes five years after the initial report reveals clinically relevant changes in 18%”的配套数据文件,包含152例研究外显子组的再评估与再分析结果,涉及临床相关变异信息、队列样本及基因变异数据等内容。
文件详解
- README.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文件,包含文件结构、内容概述等信息
- FileS2_conNDD-cohort.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含Reuter等人先前鉴定的所有变异、本项目重新评估的变异及新增变异,同时记录家庭、个体、样本信息及本项目评估的BAM文件信息
- FileS3_conNDD-variants.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含队列分析的所有变异数据,具体子表包括:in silico预测工具阈值表、外显子组范围纯合变异表(分A45、LGD、错义、剪接4类)、SysID数据库中神经发育障碍显性基因过滤的外显子组变异表(分4类)、SysID数据库中神经发育障碍隐性基因过滤的外显子组变异表(分4类)、队列拷贝数变异(CN)调用表、纯合子运行(RoH)区域调用表
适用场景
- 临床遗传学研究:分析152例研究外显子组的临床相关变异变化,支持遗传病诊断与机制研究
- 基因变异再评估:对比初始报告与五年后再分析的变异结果,探究外显子组分析的时效性与准确性
- 神经发育障碍基因研究:基于SysID数据库的显性/隐性基因过滤结果,研究神经发育障碍相关基因变异特征
- 生物信息学方法验证:利用in silico预测工具阈值及变异分类数据,验证基因变异分析工具的性能