拟南芥自然种群中短串联重复序列长度变异与基因表达关联数据集

数据集概述

本数据集围绕拟南芥自然种群展开,探究短串联重复序列(STRs)长度变异与基因表达的关联。通过转录组数据建模分析STR长度对基因表达的影响,并结合实验验证,为理解植物基因表达调控及适应性进化提供数据支持。

文件详解

  • 分析结果与模型文件:
  • GeneExp.Figures.html:HTML格式,展示基因表达相关图表
  • GeneExp.Modelling.html:HTML格式,呈现基因表达建模分析内容
  • 210217.SuppDataSet9.FisherExact.xlsx:Excel格式,包含Fisher精确检验结果
  • 210217.SuppDataSet6.ModelResultsRealSTRs.tsv:TSV格式,真实STRs的模型结果数据
  • 210217.SuppDataSet5.ModelResultsMockSTRs.tsv:TSV格式,模拟STRs的模型结果数据
  • 210217.SuppDataSet8.ModelResultsESTRsClosestSNP.tsv:TSV格式,含eSTR位点、邻近SNP、基因及效应值等字段
  • 210217.SuppDataSet7.ModelResultsSNPs.tsv:TSV格式,SNP相关模型结果数据
  • 210217.SuppDataSet10.NamedGenesWithESTRs.xlsx:Excel格式,含eSTRs的命名基因信息
  • 210217.SuppDataSet1.GO.xlsx:Excel格式,基因本体(GO)分析数据
  • 210217.SuppDataSet12.GUS_FRETDataAndStatistics.xlsx:Excel格式,GUS和FRET实验数据及统计结果
  • 210217.ExtraMaterial.logX.tsv:TSV格式,基因表达相关log转换数据
  • 代码文件:
  • GeneExp.Modelling.ipynb:Jupyter Notebook格式,基因表达建模代码
  • GeneExp.Figures.ipynb:Jupyter Notebook格式,图表生成代码
  • 辅助数据文件:
  • 210217.ExtraMaterial.STRsWithin100kbOfGenes.pickled:pickled格式,基因周围100kb内的STRs数据
  • 210217.ExtraMaterial.Araport11.genes.bed:BED格式,Araport11基因注释数据
  • 210217.SuppDataSet11.AL6_CDS.fa:FASTA格式,AL6基因编码序列
  • 210217.SuppDataSet4.Validation.csv:CSV格式,实验验证相关数据

适用场景

  • 植物分子生物学研究:分析STR长度变异对拟南芥基因表达的调控机制
  • 进化生物学研究:探究STR变异在植物适应性进化中的作用
  • 基因表达调控研究:构建基因表达与STR长度关联的模型及验证
  • 功能基因组学研究:挖掘影响基因表达的非编码序列变异
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 515.88 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。