数据集概述
该数据集为博士论文第三章的补充文件,围绕真菌界转座元件的共选择研究展开,包含物种元数据、融合候选基因、PFAM结构域等相关补充表格及说明文档,支持对真菌转座元件功能及进化机制的分析。
文件详解
该数据集包含10个文件,具体说明如下:
- 文本表格文件(.txt格式,共7个):
- Supplementary_Table1_speciesMetadata.txt:物种元数据文件,包含shortID、Organism、SpeciesTaxid、SpeciesName、AssemblyName、AssemblyAccession、Taxid、FtpPath_GenBank、phylum、class、order、family、genus、protein_file、genome_file、cds_file、yeast、seqCounts、totalBases、GC、avgLen等字段
- Supplementary_Table3_candidates.txt:候选基因表格文件
- Supplementary_Table_S2_additionalPFAM.txt:补充PFAM结构域信息文件
- Supplementary_TableS4_fusion_candidates.txt:融合候选基因初筛表格文件
- Supplementary_TableS5_fusion_candidates_finetune.txt:融合候选基因微调表格文件
- Supplementary_TableS6_Candidate_PFAM.txt:候选PFAM结构域表格文件
- Supplementary_File_F1_species_tree.txt:物种树数据文件
- PDF说明文件(.pdf格式,共3个):
- S1_FusionsCharacteristics.pdf:融合基因特征说明文档
- S2_Functions_fine_tuned_candidates.pdf:微调候选基因功能说明文档
- S3_Candidate_PFAMs.pdf:候选PFAM结构域说明文档
适用场景
- 真菌分子生物学研究:分析真菌转座元件的共选择机制
- 基因组进化研究:探究转座元件在真菌基因组中的功能及进化轨迹
- 生物信息学分析:验证转座元件融合基因的预测结果
- 真菌分类学研究:支持基于转座元件特征的真菌物种分类分析