数据集概述
本数据集围绕癌症患者来源的停乳链球菌菌株,基于纳米孔技术的甲基化组分析展开,包含原始分析输出、可重复性分析表格及模块化分析的Python代码,为验证甲基化检测的准确性与可重复性提供数据支持。
文件详解
- 原始分析输出压缩包:
- 9728_10237_ORA+HRA_all_reps_microbemod_output.zip: 包含所有菌株(9728、10237)所有重复样本的MicrobeMod原始输出,内容涉及甲基化位点、基序和RM系统预测结果,以及映射至GenBank特征的甲基化数据和特征计数矩阵。
- 可重复性分析表格压缩包:
- 9728_HRA_reproducibility_analysis_tables.zip: 菌株9728在HRA条件下的可重复性分析表格
- 9728_ORA_reproducibility_analysis_tables.zip: 菌株9728在ORA条件下的可重复性分析表格
- 10237_HRA_5mC_6mA_reproducibility_analysis_tables.zip: 菌株10237在HRA条件下5mC与6mA修饰的可重复性分析表格
- 10237_ORA_reproducibility_analysis_tables.zip: 菌株10237在ORA条件下的可重复性分析表格
- Python代码文件:
- methylation_feature_hash_assert_FILTER_9728.py: 菌株9728带过滤条件的甲基化特征哈希分析代码
- methylation_feature_hash_NOFILTER_9728.py: 菌株9728无过滤条件的甲基化特征哈希分析代码
- methylation_feature_hash_motif_10237.py: 菌株10237基于基序的甲基化特征哈希分析代码
- hyb_vs_ont_per_replicate_comparison.py: 混合测序与纳米孔测序的单重复样本比较代码
- hyb_vs_ont_combined_plot.py: 混合测序与纳米孔测序的合并结果可视化代码
适用场景
- 微生物表观遗传学研究: 分析停乳链球菌甲基化修饰的特征及可重复性
- 纳米孔测序技术验证: 评估纳米孔技术在甲基化组检测中的准确性
- 生物信息学方法开发: 复现或扩展基于特征注释的甲基化模块化分析流程
- 临床微生物研究: 探索癌症患者来源菌株的甲基化修饰与宿主关联机制