数据集概述
该数据集是论文“Approaching Single-Molecule Assembly-Free Readout from Medium-Length Encoded DNA”的补充数据,包含DNA存储相关的原始数据文件、编码码字、序列及纳米孔测序原始电信号,支持DNA存储实时读取研究。
文件详解
该数据集包含一个压缩文件,具体说明如下:
- 文件名称: Real-Time-Data-Readout-for-DNA-Storage.zip
- 文件格式: ZIP (.zip)
- 压缩包内文件(基于表1描述):
- File 1.txt: 945字节,码率1/3,含22,680位编码码字、22,680位水印序列、22,680碱基对编码序列
- File 2.txt: 945字节,码率1/3,含22,680位编码码字、22,680位水印序列、22,680碱基对编码序列
- File 3.txt: 4,032字节,码率1/2,含64,512位编码码字、64,512位水印序列、64,512碱基对编码序列
- File 4.txt: 3,716字节,码率0.93,含32,000位编码码字、32,000位水印序列、32,000碱基对编码序列
- 其他包含内容: 质粒序列、伪噪声序列、纳米孔测序原始电信号(POD5格式)
数据来源
NCBI Sequence Read Archive(登录号PRJNA1235219)
适用场景
- DNA存储技术研究: 分析中长链编码DNA的单分子无组装读取性能
- 编码算法优化: 基于不同码率的编码数据,优化DNA存储编码策略
- 纳米孔测序应用: 利用原始电信号数据,研究DNA存储实时读取技术
- 生物信息学分析: 处理和解析DNA存储中的编码序列与信号数据