人工免疫球蛋白重链序列数据集

数据集概述

该数据集包含由JoinSimulation软件生成的人工免疫球蛋白重链(IgH)序列,共十万条序列,以TSV格式存储,为免疫球蛋白序列相关研究提供基础数据支持。

文件详解

  • 文件名称: joinsim.txt
  • 文件格式: TXT(TSV格式)
  • 字段映射示例:
  • QueryID: 查询ID
  • Sequence: 免疫球蛋白重链序列
  • VExoStart: V基因外切起始位置
  • VExoEnd: V基因外切结束位置
  • DExoStart: D基因外切起始位置
  • DExoEnd: D基因外切结束位置
  • JExoStart: J基因外切起始位置
  • JExoEnd: J基因外切结束位置
  • VStart: V基因起始位置
  • VStop: V基因结束位置
  • DStart: D基因起始位置
  • DStop: D基因结束位置
  • JStart: J基因起始位置
  • JStop: J基因结束位置
  • Mutations: 突变情况
  • Indels: 插入缺失情况
  • Expected.VAlign0/1/2/3: 预期V基因比对结果(部分字段)

适用场景

  • 免疫信息学研究: 用于分析免疫球蛋白重链序列的结构特征与变异规律
  • 生物信息学工具验证: 可作为测试数据,验证序列分析算法或软件的准确性
  • 免疫学教学: 为免疫学课程中免疫球蛋白基因重排机制的教学提供示例数据
  • 计算生物学建模: 支持免疫球蛋白序列生成模型的训练与优化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 42.53 MiB
最后更新 2025年11月27日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。