数据集

蛋白质相互作用预测正负样本序列数据集-spandansureja

蛋白质相互作用预测正负样本序列数据集-spandansureja 数据来源：互联网公开数据标签：蛋白质,相互作用,序列,生物信息学,机器学习,蛋白质组学,预测模型数据概述：本数据集包含两类蛋白质序列对，用于训练和评估蛋白质相互作用预测模型。数据集主要包含两个文件：positive_protein_sequences 和 negative_protein_sequences。positive_protein_sequences 文件包含 36,652 对已知存在相互作用的蛋白质序列；negative_protein_sequences 文件包含 36,480 对已知不存在相互作用的蛋白质序列。数据集中每条记录均由一对蛋白质序列构成，这些序列可以用于构建机器学习模型，以预测蛋白质之间是否会发生相互作用。数据用途概述：该数据集主要用于开发和评估基于序列的蛋白质相互作用预测模型。研究人员可以利用该数据集训练各种机器学习算法，如支持向量机（SVM）、神经网络等，以预测蛋白质之间的相互作用。此外，该数据集也可用于探索蛋白质序列特征与相互作用之间的关系，以及评估不同特征提取方法对预测性能的影响。此外，该数据集也适用于生物信息学教学，帮助学生理解蛋白质相互作用的机制和预测方法，并进行实践操作。

数据与资源

versions_20250405073433.zipZIP
47.69 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	47.69 MiB
最后更新	2025年4月22日
创建于	2025年4月22日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

蛋白质相互作用预测正负样本序列数据集-spandansureja

数据与资源

附加信息

注册成功！