数据集概述
本数据集是sager包使用的测试数据文件集,包含经过处理的生物样本分析文件,如mzML格式的质谱数据文件、TSV格式的定量和鉴定结果文件,以及JSON格式的配置文件。数据可通过sagerData()函数下载、缓存和获取,版本更新涉及文件子集优化和格式调整,总计包含6个文件。
文件详解
- mzML数据文件(3个)
- 文件名称:subset_dq_00086_11cell_90min_hrMS2_A9.mzML、subset_dq_00084_11cell_90min_hrMS2_A5.mzML、subset_dq_00087_11cell_90min_hrMS2_A11.mzML
- 文件格式:mzML
- 字段映射介绍:生物样本的质谱分析原始数据文件,包含11cell样本的90分钟hrMS2实验数据
- TSV结果文件(2个)
- 文件名称:92fe0301bd0ba_quant.tsv、92fe02655fa2c_results.sage.tsv
- 文件格式:TSV
- 字段映射介绍:
- 92fe0301bd0ba_quant.tsv:包含file、scannr、ion_injection_time、tmt_1至tmt_11等定量分析字段
- 92fe02655fa2c_results.sage.tsv:包含peptide、proteins、num_proteins、filename、scannr、rank、label、expmass、calcmass等鉴定结果字段
- JSON配置文件(1个)
- 文件名称:92fe02e3cc083_results.json
- 文件格式:JSON
- 字段映射介绍:包含database、quant、precursor_tol、fragment_tol、isotope_errors等配置参数的对象结构
数据来源
sager package仓库
适用场景
- 生物信息学工具测试: 用于sager包的功能验证、版本更新测试和数据处理流程验证
- 质谱数据分析方法研究: 基于mzML文件和TSV结果,探索质谱数据的定量分析和肽段鉴定方法
- 蛋白质组学实验数据处理: 分析11cell样本的质谱数据,研究蛋白质组学实验的定量结果
- 生物信息学配置参数优化: 通过JSON配置文件,研究质谱数据分析中的参数设置对结果的影响