癌症患者停乳链球菌菌株纳米孔甲基化组分析可重复性与准确性数据集

数据集概述

本数据集围绕癌症患者来源的停乳链球菌菌株,基于纳米孔技术的甲基化组分析展开,包含原始分析输出、可重复性分析表格及模块化分析的Python代码,为验证甲基化检测的准确性与可重复性提供数据支持。

文件详解

  • 原始分析输出压缩包:
  • 9728_10237_ORA+HRA_all_reps_microbemod_output.zip: 包含所有菌株(9728、10237)所有重复样本的MicrobeMod原始输出,内容涉及甲基化位点、基序和RM系统预测结果,以及映射至GenBank特征的甲基化数据和特征计数矩阵。
  • 可重复性分析表格压缩包:
  • 9728_HRA_reproducibility_analysis_tables.zip: 菌株9728在HRA条件下的可重复性分析表格
  • 9728_ORA_reproducibility_analysis_tables.zip: 菌株9728在ORA条件下的可重复性分析表格
  • 10237_HRA_5mC_6mA_reproducibility_analysis_tables.zip: 菌株10237在HRA条件下5mC与6mA修饰的可重复性分析表格
  • 10237_ORA_reproducibility_analysis_tables.zip: 菌株10237在ORA条件下的可重复性分析表格
  • Python代码文件:
  • methylation_feature_hash_assert_FILTER_9728.py: 菌株9728带过滤条件的甲基化特征哈希分析代码
  • methylation_feature_hash_NOFILTER_9728.py: 菌株9728无过滤条件的甲基化特征哈希分析代码
  • methylation_feature_hash_motif_10237.py: 菌株10237基于基序的甲基化特征哈希分析代码
  • hyb_vs_ont_per_replicate_comparison.py: 混合测序与纳米孔测序的单重复样本比较代码
  • hyb_vs_ont_combined_plot.py: 混合测序与纳米孔测序的合并结果可视化代码

适用场景

  • 微生物表观遗传学研究: 分析停乳链球菌甲基化修饰的特征及可重复性
  • 纳米孔测序技术验证: 评估纳米孔技术在甲基化组检测中的准确性
  • 生物信息学方法开发: 复现或扩展基于特征注释的甲基化模块化分析流程
  • 临床微生物研究: 探索癌症患者来源菌株的甲基化修饰与宿主关联机制
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 50.11 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。