数据集概述
本数据集为DoTA-seq测序reads处理后生成的barcode与read映射表数据,包含3个文件,可用于生成相关研究的1-3号图表。数据无训练/测试、数据/标签、原始/处理拆分,主要文件类型为xlsx和csv,覆盖bfragilis、gutcommunity、colibs三类样本数据。
文件详解
- bfragilis-data.csv
- 文件格式:CSV
- 字段映射介绍:包含barcode序列(如GATTAAGCCATCCCA、GAATAATGTCTCGGG)及对应PSA_ON、PSA_OFF、PSB_ON、PSB_OFF、PSD_ON、PSD_OFF、PSE_ON、PSE_OFF、PSF_ON、PSF_OFF、PSG_ON、PSG_OFF、PSH_ON、PSH_OFF等14个状态的计数数据
- gutcommunity-data.xlsx
- 文件格式:XLSX
- 字段映射介绍:gutcommunity样本的barcode与read映射数据(具体字段未预览,推测与bfragilis-data.csv结构类似)
- colibs-data.xlsx
- 文件格式:XLSX
- 字段映射介绍:colibs样本的barcode与read映射数据(具体字段未预览,推测与bfragilis-data.csv结构类似)
适用场景
- 测序数据映射分析: 用于DoTA-seq技术中barcode与测序read的关联分析
- 基因表达/调控研究: 基于不同状态(如PSA_ON/OFF、PSB_ON/OFF等)的计数数据,分析基因表达或调控模式
- 微生物群落研究: 通过gutcommunity、bfragilis、colibs样本数据,探究肠道菌群等微生物群落的分子特征
- 科研图表生成: 作为生成相关研究1-3号图表的基础数据来源