病毒和细菌中基因进化数据集
数据来源:互联网公开数据
标签:基因进化,病毒,细菌,生物信息学,遗传学,进化生物学,生命科学
数据概述:
本数据集包含病毒和细菌中基因进化的详细记录,旨在探索生命的极限。数据来源于美国国家生物技术信息中心(NCBI),涵盖了不同物种的基因序列信息、生物样本和项目编号等关键要素。数据集包括多个文件,详细记录了基因名称、长度、生物体信息、基因编码区特征、基因组大小及GC含量等多项指标,为基因进化研究提供了丰富的数据支持。
数据用途概述:
该数据集适用于基因进化研究、环境条件对基因进化影响分析、不同突变对基因进化影响研究等多种场景。研究人员可以利用此数据集进行深入的基因进化机制研究;制药公司可以利用数据识别潜在的药物靶点;教育机构可借助数据进行教学和科研活动,促进学生对基因进化的理解。
举例:
病毒和细菌中基因进化数据集包含多个文件,如Escherichia_virus_T4.csv记录了T4噬菌体的基因组信息,包括生物体名称、分组、样本编号、项目编号、组装编号、组装级别、大小、GC含量、复制子、宿主、编码区特征、邻近基因、发布日期、GenBank FTP地址和RefSeq FTP地址等信息。NCBI_Escherichia_coli_genomes.csv文件记录了大肠杆菌的基因组信息,如生物体名称、分组、样本编号、项目编号、组装编号、组装级别、大小、GC含量、复制子、编码区特征、发布日期、GenBank FTP地址、RefSeq FTP地址、菌株名称、WGS编号和支架信息等。GCA_000005845.2_ASM584v2_protein.annotations.csv文件则记录了基因名称和基因长度等信息。