数据集概述
本数据集为基于ChlaMmeSeq技术的莱茵衣藻突变体高通量基因分型数据,包含11,478个插入位点的测序结果,覆盖39%的注释蛋白编码基因。数据验证了插入位点的随机分布特征,揭示了转化DNA的核酸内切酶切割规律,支持藻类功能基因的大规模筛选与研究。
文件详解
- 说明文件
- 文件名称:README.txt
- 文件格式:TXT
- 字段映射介绍:数据集说明文档,包含数据背景、文件清单及使用说明
- 原始数据文件
- 文件名称:Supplemental_Dataset_7_insertion-list_Fig3-repl-a_raw.txt、Supplemental_Dataset_8_insertion-list_Fig3-repl-b_raw.txt、Supplemental_Dataset_10_insertion-list_Fig5-5prime_raw.txt
- 文件格式:TXT
- 字段映射介绍:包含染色体、链方向、插入前位置、基因、基因方向、基因特征、总读数、顶部读段序列、插入 cassette 等原始插入位点数据
- 过滤数据文件
- 文件名称:Supplemental_Dataset_9_insertion-list_Fig3-both_filtered.txt
- 文件格式:TXT
- 字段映射介绍:经过过滤的插入位点列表数据,用于图3的分析
- 引物与寡核苷酸文件
- 文件名称:Supplemental_Dataset_2_primer_pairs_used_for_check-PCR.xlsx、Supplemental_Dataset_3_oligos_used_in_the_paper.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含实验所用的PCR验证引物对及寡核苷酸序列信息
- 单个突变体验证数据
- 文件名称:Supplemental_Dataset_1_mapping_sites_of_individual_mutants.xlsx
- 文件格式:XLSX
- 字段映射介绍:单个突变体插入位点的验证映射数据
- 分析程序文件
- 文件名称:Supplemental_Dataset_6_analysis_programs.tar.gz
- 文件格式:GZ
- 字段映射介绍:包含数据分析所用的程序代码压缩包
- 序列基序文件
- 文件名称:Supplemental_Dataset_5_cassette_fragmentation_motifs.txt
- 文件格式:TXT
- 字段映射介绍:转化DNA cassette片段化的序列基序数据
数据来源
论文“High-throughput genotyping of green algal mutants reveals random distribution of mutagenic insertion sites and endonucleolytic cleavage of transforming DNA”
适用场景
- 藻类功能基因组学研究: 用于莱茵衣藻全基因组范围的基因功能筛选,识别光合作用、脂代谢等通路相关基因
- 突变体库构建: 支持索引突变体库的生成,为大规模遗传筛选提供资源
- 基因插入机制研究: 分析转化DNA的核酸内切酶切割规律及插入位点分布特征
- 分子生物学实验设计: 利用引物与寡核苷酸数据开展莱茵衣藻的基因编辑与验证实验
- 藻类代谢通路解析: 结合插入位点数据鉴定参与碳浓缩机制、光趋化性等过程的关键基因