数据集概述
本数据集围绕拟南芥自然种群展开,探究短串联重复序列(STRs)长度变异与基因表达的关联。通过转录组数据建模分析STR长度对基因表达的影响,并结合实验验证,为理解植物基因表达调控及适应性进化提供数据支持。
文件详解
- 分析结果与模型文件:
- GeneExp.Figures.html:HTML格式,展示基因表达相关图表
- GeneExp.Modelling.html:HTML格式,呈现基因表达建模分析内容
- 210217.SuppDataSet9.FisherExact.xlsx:Excel格式,包含Fisher精确检验结果
- 210217.SuppDataSet6.ModelResultsRealSTRs.tsv:TSV格式,真实STRs的模型结果数据
- 210217.SuppDataSet5.ModelResultsMockSTRs.tsv:TSV格式,模拟STRs的模型结果数据
- 210217.SuppDataSet8.ModelResultsESTRsClosestSNP.tsv:TSV格式,含eSTR位点、邻近SNP、基因及效应值等字段
- 210217.SuppDataSet7.ModelResultsSNPs.tsv:TSV格式,SNP相关模型结果数据
- 210217.SuppDataSet10.NamedGenesWithESTRs.xlsx:Excel格式,含eSTRs的命名基因信息
- 210217.SuppDataSet1.GO.xlsx:Excel格式,基因本体(GO)分析数据
- 210217.SuppDataSet12.GUS_FRETDataAndStatistics.xlsx:Excel格式,GUS和FRET实验数据及统计结果
- 210217.ExtraMaterial.logX.tsv:TSV格式,基因表达相关log转换数据
- 代码文件:
- GeneExp.Modelling.ipynb:Jupyter Notebook格式,基因表达建模代码
- GeneExp.Figures.ipynb:Jupyter Notebook格式,图表生成代码
- 辅助数据文件:
- 210217.ExtraMaterial.STRsWithin100kbOfGenes.pickled:pickled格式,基因周围100kb内的STRs数据
- 210217.ExtraMaterial.Araport11.genes.bed:BED格式,Araport11基因注释数据
- 210217.SuppDataSet11.AL6_CDS.fa:FASTA格式,AL6基因编码序列
- 210217.SuppDataSet4.Validation.csv:CSV格式,实验验证相关数据
适用场景
- 植物分子生物学研究:分析STR长度变异对拟南芥基因表达的调控机制
- 进化生物学研究:探究STR变异在植物适应性进化中的作用
- 基因表达调控研究:构建基因表达与STR长度关联的模型及验证
- 功能基因组学研究:挖掘影响基因表达的非编码序列变异