"英文标题:Global Human Disease Pathogenic Gene Locus Genetic Information Database
数据集概述
记录人类主要疾病的致病基因位点与遗传特征,涵盖常见慢性病、遗传性疾病等疾病类型的基因变异位点、等位基因频率、遗传模式及关联表型等核心遗传信息。
数据按疾病类型、基因位点层级组织,覆盖全球主要族群和人群队列,跨越长期的医学遗传学研究周期。颗粒度精确到单个基因位点、单族群层级,支持跨疾病、跨人群的遗传关联分析。数据结构遵循医学遗传学领域标准的遗传标记数据格式,字段定义符合国际人类基因组变异学会(HGVS)规范,可直接用于基因组学研究与验证。
该数据集是解析疾病遗传致病机制的核心资源,为医学研究、临床诊断及精准医疗方案设计提供基础支撑。致病基因位点的遗传特征直接关联疾病易感性、发病风险及治疗反应,掌握这些信息对于识别遗传高危人群、开发靶向治疗药物、制定个性化预防策略均具有关键作用,也可用于验证遗传学研究中的关联假设与致病通路模型。
字段详情
数据集包含以下核心字段:
disease_ontology_id:疾病本体论ID,唯一标识标准化疾病类型,遵循DOID规范
variant_hgvs:变异位点HGVS命名,标识基因变异的精确位置与类型,遵循HGVS标准格式
allele_frequency:等位基因频率,单位百分比,指特定变异在研究人群中的携带比例
inheritance_pattern:遗传模式,描述变异导致疾病的传递方式,如常染色体显性、隐性等
phenotype_annotation:表型注释,描述与变异关联的临床表型特征
cohort_ancestry:队列族群,标识研究人群的遗传背景分类,如欧洲裔、东亚裔等
适用场景
- 医学遗传学研究人员分析疾病遗传致病通路与基因-表型关联
- 精准医疗企业开发基于基因位点的疾病风险预测模型
- 临床诊断机构验证罕见遗传性疾病的致病基因变异
- 药物研发公司筛选靶向疾病相关基因的候选药物靶点
- 公共卫生部门识别特定族群的疾病遗传高危人群"