蛋白质突变深度扫描数据集ProteinMutationDeepScanningDataset-ricarn
数据来源:互联网公开数据
标签:蛋白质, 突变, 深度扫描, 基因, 生物信息学, 结构生物学, 机器学习, 蛋白质工程
数据概述:
该数据集包含来自多个研究机构的蛋白质突变深度扫描(DMS)实验数据,记录了不同蛋白质在特定突变下的功能变化。主要特征如下:
时间跨度:数据未明确标明具体时间,但包含了多个研究年份的数据,反映了DMS研究的最新进展。
地理范围:数据来源于全球范围内的生物学研究,涵盖了多种生物体,包括人类、酵母、细菌等。
数据维度:数据集包含多个CSV文件,每个文件对应一个蛋白质的DMS实验结果。主要数据项包括突变体(mutant)、突变序列(mutated_sequence)、DMS评分(DMS_score)、DMS评分分箱(DMS_score_bin)、突变深度(mutation_depth)和随机倍数(fold_rand_multiples)等。
数据格式:CSV格式,每个文件包含蛋白质突变及其对应的功能表征数据,便于进行数据分析和建模。
来源信息:数据集来源于公开的生物学研究,数据经过标准化处理,方便进行跨数据集的比较和分析。
该数据集适合用于蛋白质结构与功能研究、突变效应预测和蛋白质工程等领域。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于生物信息学、结构生物学和蛋白质工程等领域的学术研究,如突变对蛋白质功能的影响分析、蛋白质结构-功能关系研究等。
行业应用:可以为药物研发、生物技术公司提供数据支持,用于预测药物靶标的突变耐药性、优化蛋白质设计等。
决策支持:支持蛋白质工程领域的实验设计和优化,加速新蛋白质的开发和改造。
教育和培训:作为生物信息学、蛋白质工程等课程的实训数据,帮助学生和研究人员深入理解蛋白质突变对功能的影响。
此数据集特别适合用于探索蛋白质序列与功能的关联,预测突变对蛋白质活性的影响,并优化蛋白质设计,从而加速生物技术领域的创新。