数据集概述
本数据集包含发酵食品来源生物活性肽的预测结果,涵盖5项发酵食品蛋白质组学研究、约200株BacDive数据库的发酵食品细菌分离株及约11500个发酵食品宏基因组组装基因组(MAGs)。通过bac-mining和peptide-bioactivity-prediction工作流程,生成肽段理化特征及生物活性预测数据,为发酵食品功能肽研究提供支持。
文件详解
- 肽组学结果文件
- all_ff_proteomics_samples_combined.fasta:FASTA格式,包含5项蛋白质组学研究的原始蛋白质序列(未去重),来源为PRIDE数据库或研究补充文件
- ff_peptidomics_peptides_predictions.tsv:TSV格式,记录5项蛋白质组学研究所有原始序列的理化特征及生物活性预测结果,字段包括peptide_id、sequence、aliphatic_index、boman_index、charge等
- 细菌基因组肽段结果文件
- 2025-02-24-bacdive-peptides-predictions.tsv:TSV格式,BacDive数据库200株发酵食品细菌分离株的肽段预测结果,字段同肽组学结果文件
- 2025-08-05-mag-bioactivity-info.tsv:TSV格式,11500个发酵食品MAGs的肽段预测结果,字段同肽组学结果文件
- 机器学习模型文件
- ANIF_1.zip:ZIP格式,基于Peptipedia数据库构建的抗炎活性预测模型原始文件
- ANIF_2_BM.zip:ZIP格式,基于Immune Epitope Database基准数据集构建的抗炎活性预测模型原始文件
- IMM_1.zip:ZIP格式,基于Peptipedia数据库构建的免疫调节活性预测模型原始文件
- ANIF_benchmark_data.zip:ZIP格式,用于构建ANIF_2_BM模型的抗炎基准数据集FASTA序列
适用场景
- 发酵食品功能研究:分析不同发酵食品中潜在生物活性肽的分布特征
- 食品生物技术开发:挖掘具有抗炎、免疫调节活性的功能性肽段资源
- 微生物组学研究:探究发酵食品微生物基因组编码的活性肽潜力
- 机器学习模型应用:验证和优化肽段生物活性预测模型的性能
- 食品营养科学:研究发酵过程中蛋白质降解产生的功能性肽理化特性