免疫原性预测多任务学习框架数据集

数据集概述

该数据集为ImmunoMTL多任务学习框架配套数据,包含MMS聚类、ImmunoMTL模型的训练与验证数据,以及基准测试、零样本学习等场景数据,用于支持免疫原性预测、新抗原优先级排序等下游应用。

文件详解

该数据集包含主目录及子目录下的CSV格式文件,具体说明如下: - 主目录文件: - HN_training.csv: CSV格式,字段包括Peptide(多肽)、MHC(主要组织相容性复合体)、MHC_cluster(MHC聚类)、Label(标签)、mhcflurry_present_score(MHC结合评分)等 - training.csv: CSV格式,字段包括Peptide、MHC、Label、Source(数据来源)、pMHC(多肽-MHC复合物)、cluster(聚类)等 - mRNAvaccine_pID.csv: CSV格式,未提供预览字段 - zeroshot_data.csv、zeroshot_data2.csv: CSV格式,未提供预览字段 - benchmark.csv: CSV格式,未提供预览字段 - MMS clustering子目录文件: - MHCmotifatlas_testing.csv: CSV格式,未提供预览字段 - MHCflurry_training.csv: CSV格式,未提供预览字段 - MHCmotifatlas_filtered.csv: CSV格式,未提供预览字段 - MHCflurry_filtered.csv: CSV格式,未提供预览字段

数据来源

公开资源

适用场景

  • 免疫原性预测模型训练与验证
  • MHC分子聚类分析研究
  • 新抗原优先级排序算法开发
  • 免疫应答建模下游应用
  • 零样本学习场景下的免疫数据测试
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 52.34 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。