C_bovis_Genome_Source_牛隐杆线虫基因组与进化分析数据

数据集概述

本数据集为论文“The genome of C. bovis”的核心数据文件,包含牛隐杆线虫(C. bovis)参考基因组序列、注释信息及进化分析相关数据。具体涵盖35种隐杆线虫的直系同源基因超矩阵、物种进化树、基因组注释文件、编码序列、蛋白质序列、基因组支架序列、直系同源基因聚类文件,以及补充表格(基因家族统计、软件参数、数据登录号),共10个文件,支持线虫基因组结构与进化研究。

文件详解

  • 物种进化分析文件
  • 文件名称:caenorhabditis_35species_1167orthos.supermatrix.fa
  • 文件格式:FA
  • 字段映射介绍:包含35种隐杆线虫的1167个单拷贝直系同源基因的串联比对超矩阵,用于推断物种进化树
  • 文件名称:caenorhabditis_35species_1167orthos.treefile
  • 文件格式:treefile
  • 字段映射介绍:IQ-TREE生成的隐杆线虫物种进化树,Newick格式
  • 基因组序列与注释文件
  • 文件名称:CBOVI.caenorhabditis_bovis_LS_v1.annotations.gff3
  • 文件格式:GFF3
  • 字段映射介绍:BRAKER生成的牛隐杆线虫参考基因组注释文件
  • 文件名称:CBOVI.caenorhabditis_bovis_LS_v1.cds.fna
  • 文件格式:FNA
  • 字段映射介绍:BRAKER预测的牛隐杆线虫参考基因组编码序列(CDS)
  • 文件名称:CBOVI.caenorhabditis_bovis_LS_v1.proteins.faa
  • 文件格式:FAA
  • 字段映射介绍:BRAKER预测的牛隐杆线虫参考基因组蛋白质/氨基酸序列
  • 文件名称:CBOVI.caenorhabditis_bovis_LS_v1.scaffolds.fna
  • 文件格式:FNA
  • 字段映射介绍:牛隐杆线虫参考基因组FASTA文件(含contigs,命名为scaffold.fna以匹配其他隐杆线虫文件名)
  • 直系同源基因聚类文件
  • 文件名称:Orthogroups.txt
  • 文件格式:TXT
  • 字段映射介绍:OrthoFinder生成的直系同源基因聚类文件,包含牛隐杆线虫、32种其他隐杆线虫及2种外类群Diploscapter的蛋白质序列聚类信息
  • 补充表格文件
  • 文件名称:TableS3_gene_families.tsv
  • 文件格式:TSV
  • 字段映射介绍:基因家族统计表格,含每个直系同源基因群在牛隐杆线虫中的数量、其他物种的平均值及Pfam功能注释
  • 文件名称:TableS6_software_params.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:研究中使用的软件版本及相关参数
  • 文件名称:TableS7_phylogenomics_accessions.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:直系同源基因聚类和系统基因组学分析所用数据的登录号

数据来源

论文“The genome of C. bovis”

适用场景

  • 线虫基因组结构分析: 利用基因组序列、CDS及蛋白质序列文件,研究牛隐杆线虫基因组的结构特征与基因组成
  • 线虫物种进化研究: 通过超矩阵和进化树文件,分析隐杆线虫属的系统发育关系与进化历史
  • 基因功能注释分析: 结合GFF3注释文件和Pfam功能注释表格,探究牛隐杆线虫基因的功能分类与特性
  • 直系同源基因进化分析: 利用直系同源基因聚类文件,研究隐杆线虫属基因家族的扩张与收缩机制
  • 生物信息学方法复现: 通过软件参数表格,复现本研究中基因组注释、进化树构建等分析流程
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 171.83 MiB
最后更新 2026年1月21日
创建于 2026年1月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。