发酵食品预测生物活性肽数据集

数据集概述

本数据集包含发酵食品来源生物活性肽的预测结果,涵盖5项发酵食品蛋白质组学研究、约200株BacDive数据库的发酵食品细菌分离株及约11500个发酵食品宏基因组组装基因组(MAGs)。通过bac-mining和peptide-bioactivity-prediction工作流程,生成肽段理化特征及生物活性预测数据,为发酵食品功能肽研究提供支持。

文件详解

  • 肽组学结果文件
  • all_ff_proteomics_samples_combined.fasta:FASTA格式,包含5项蛋白质组学研究的原始蛋白质序列(未去重),来源为PRIDE数据库或研究补充文件
  • ff_peptidomics_peptides_predictions.tsv:TSV格式,记录5项蛋白质组学研究所有原始序列的理化特征及生物活性预测结果,字段包括peptide_id、sequence、aliphatic_index、boman_index、charge等
  • 细菌基因组肽段结果文件
  • 2025-02-24-bacdive-peptides-predictions.tsv:TSV格式,BacDive数据库200株发酵食品细菌分离株的肽段预测结果,字段同肽组学结果文件
  • 2025-08-05-mag-bioactivity-info.tsv:TSV格式,11500个发酵食品MAGs的肽段预测结果,字段同肽组学结果文件
  • 机器学习模型文件
  • ANIF_1.zip:ZIP格式,基于Peptipedia数据库构建的抗炎活性预测模型原始文件
  • ANIF_2_BM.zip:ZIP格式,基于Immune Epitope Database基准数据集构建的抗炎活性预测模型原始文件
  • IMM_1.zip:ZIP格式,基于Peptipedia数据库构建的免疫调节活性预测模型原始文件
  • ANIF_benchmark_data.zip:ZIP格式,用于构建ANIF_2_BM模型的抗炎基准数据集FASTA序列

适用场景

  • 发酵食品功能研究:分析不同发酵食品中潜在生物活性肽的分布特征
  • 食品生物技术开发:挖掘具有抗炎、免疫调节活性的功能性肽段资源
  • 微生物组学研究:探究发酵食品微生物基因组编码的活性肽潜力
  • 机器学习模型应用:验证和优化肽段生物活性预测模型的性能
  • 食品营养科学:研究发酵过程中蛋白质降解产生的功能性肽理化特性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 741.65 MiB
最后更新 2025年12月17日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。