数据集概述
本数据集为小鼠LEWES/EiJ品系的IGH基因胚系参考集,包含4个文件,涉及许可说明、带间隙/无间隙的FASTA序列文件及JSON格式数据,发布于Open Germline Receptor Database(OGRDB),用于生物信息学领域的基因研究。
文件详解
- licence.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集的许可声明,标注采用Creative Commons CC0 1.0协议发布
- EiJ IGH_rev_1_gapped.fasta
- 文件格式:FASTA
- 字段映射介绍:带间隙的IGH基因胚系序列文件,用于基因序列比对与分析
- EiJ IGH_rev_1_ungapped.fasta
- 文件格式:FASTA
- 字段映射介绍:无间隙的IGH基因胚系序列文件,提供连续的基因序列数据
- EiJ IGH_rev_1.json
- 文件格式:JSON
- 字段映射介绍:结构化的IGH基因胚系数据文件,包含基因序列的元信息与注释内容
数据来源
Open Germline Receptor Database(OGRDB)
适用场景
- 免疫遗传学研究:分析小鼠LEWES/EiJ品系IGH基因的胚系结构与变异特征
- 基因序列比对:利用FASTA文件进行基因序列的同源性比对与进化分析
- 生物信息学工具开发:基于JSON结构化数据构建基因序列分析工具
- 基因数据库构建:作为参考数据集补充至免疫球蛋白基因数据库
- 许可合规审查:通过licence.txt确认数据的合法使用范围