霞多丽基因组组装与注释数据集

数据集概述

本数据集包含霞多丽(Chardonnay)葡萄的基因组组装数据及相关注释信息,涵盖组装序列、基因预测、功能注释、重复序列、染色体定位、亲本溯源等多维度内容,为葡萄基因组学研究提供全面的数据支持。

文件详解

  • 基因组组装文件:
  • chardonnay_p-ctg.fasta.gz:FASTA格式,单倍体主组装序列(primary contigs)
  • chardonnay_h-ctg.fasta.gz:FASTA格式,单倍体组装中的交替单倍型序列(haplotigs)
  • chardonnay_primary_contigs_chromosome-order.fa.gz:FASTA格式,参考PN40024排序的主组装序列(染色体级)
  • chardonnay_haplotigs_chromosome-order.fa.gz:FASTA格式,参考PN40024排序的单倍型序列(染色体级)
  • 基因注释文件:
  • p-h.maker.gff.gz:GFF格式,Maker预测的基因注释
  • p-h.maker.proteins.faa.gz:FAA格式,预测的蛋白质序列
  • p-h.maker.transcripts.fna.gz:FNA格式,预测的转录本序列
  • p-h.maker.draft-names.tsv.gz:TSV格式,基于UniprotKB blastP结果的基因草稿名
  • p-h.orthomcl.orthoGroups.tsv.gz:TSV格式,OrthoMCL注释的基因家族
  • p-h.KEGG.tsv.gz:TSV格式,KEGG功能注释
  • 辅助注释文件:
  • p-h.repeats.gff.gz:GFF格式,RepeatMasker预测的重复序列注释
  • chardonnay_primary_contig_mappings.tsv.gz:TSV格式,主组装序列的染色体定位坐标
  • chardonnay_haplotig_mappings.tsv.gz:TSV格式,单倍型序列的染色体定位坐标
  • kmer-based_parentage.primary_contigs.bed.gz:BED格式,基于kmer方法的主组装序列亲本溯源
  • kmer-based_parentage.haplotigs.bed.gz:BED格式,基于kmer方法的单倍型序列亲本溯源
  • p-ctg.gene-expansion-candidates.tsv.gz/p-ctg.gene-expansion-candidates.bed.gz:TSV/BED格式,主组装序列中的基因扩张候选区域
  • h-ctg.gene-expansion-candidates.tsv.gz/h-ctg.gene-expansion-candidates.bed.gz:TSV/BED格式,单倍型序列中的基因扩张候选区域
  • 可视化文件:
  • PN_and_CH.FAR2.msa.png:PNG格式,霞多丽FAR2类基因扩张的多序列比对图

适用场景

  • 葡萄基因组结构解析:分析霞多丽基因组的单倍型特征与染色体组织
  • 功能基因组学研究:挖掘葡萄重要农艺性状相关的功能基因
  • 进化生物学分析:探究葡萄基因家族扩张与物种演化关系
  • 分子育种应用:开发分子标记辅助葡萄品种改良
  • 比较基因组学:与其他葡萄品种(如PN40024)进行基因组差异分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 554.05 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。