数据集概述
该数据集是RefPlantNLR的补充资料,包含经实验验证的植物NLR(核苷酸结合寡聚化结构域样受体)相关序列、注释及分析结果,涵盖氨基酸序列、CDS序列、基因组序列、结构域注释、系统发育树等多类型数据,为植物免疫研究提供基础数据支持。
文件详解
该数据集包含补充表格和数据集文件,具体说明如下:
- 补充表格文件:
- Table_S1_RefPlantNLR_v.20200528_415_Description.xlsx: Excel格式,RefPlantNLR描述表
- Table_S2_RefPlantNLR_v.20200528_415_Order.xlsx: Excel格式,RefPlantNLR中代表的植物目表
- 补充数据集文件:
- Supplemental_dataset_1_RefPlantNLR_v.20200528_415_AA.fasta: FASTA格式,415条RefPlantNLR条目氨基酸序列
- Supplemental_dataset_2_RefPlantNLR_v.20200528_415_CDS.fasta: FASTA格式,400条RefPlantNLR条目CDS序列(15条未获取)
- Supplemental_dataset_3_RefPlantNLR_v.20200528_415_LOCUS.gb: GenBank格式,329个包含RefPlantNLR基因模型的基因组位点及56条mRNA条目
- Supplemental_dataset_4_RefPlantNLR_v.20200528_415_AA.gff3: GFF3格式,415条氨基酸序列的InterProScan注释
- Supplemental_dataset_5_RefPlantNLR_v.20200528_415_CDS.gff3: GFF3格式,400条CDS序列的InterProScan注释
- Supplemental_dataset_6_RefPlantNLR_v.20200528_415_SSF52540.fasta: FASTA格式,415条条目含有的424条NB-ARC结构域氨基酸序列
- Supplemental_dataset_7_RefPlantNLR_v.20200528_415_SSF52540_Unique.fasta: FASTA格式,347条独特NB-ARC结构域氨基酸序列
- Supplemental_dataset_8_vRefPlantNLR_v.20200528_415_CLustalOmega_missing5.phy: PHYLIP格式,346条独特NB-ARC结构域的Clustal Omega比对结果(移除覆盖率低于百分之九十五的位点)
- Supplemental_dataset_9_RefPlantNLR_v.20200528_415_RAxML_bipartitionsBranchLabels.newick: Newick格式,基于最大似然法的NB-ARC结构域系统发育树
- Supplemental_dataset_10_RefPlantNLR_v.20200528_415_Representative90.fasta: FASTA格式,235条非冗余RefPlantNLR条目氨基酸序列(属内百分之九十氨基酸一致性阈值)
- Supplemental_dataset_11_RefPlantNLR_v.20200528_415_Representative90_SSF52540.fasta: FASTA格式,235条非冗余条目含有的241条NB-ARC结构域氨基酸序列
- 附录文件:
- Appendix_S1_RefPlantNLR_v.20200528_415.Rmd: R Markdown格式,生成注释和图表的R脚本
- Appendix_S2_20200423_InterPro_v5.44-79.0_Description.zip: ZIP格式,生成注释所用的InterProScan描述文件
适用场景
- 植物免疫学研究: 分析植物NLR基因的序列特征、结构域组成及进化关系
- 分子生物学实验: 为植物抗病基因的克隆、表达分析提供参考序列
- 生物信息学分析: 用于NLR基因注释流程开发、系统发育树构建方法验证
- 作物抗病育种: 挖掘潜在的抗病NLR基因资源,指导分子标记开发
- 进化生物学研究: 探究植物NLR基因家族的起源、扩张及功能分化机制