数据集概述
本数据集为人类癌症病毒比对在线表格,包含三个工作表,分别记录研究中检测到的所有病毒序列完整列表、原始比对过滤规则,以及按文库类型划分的癌症病毒检测结果表,为癌症相关病毒研究提供结构化数据支持。
文件详解
- 文件名称:
OnlineTable.xlsx
- 文件格式:XLSX
- 字段映射介绍:
- 工作表1(OT1.1-Raw virus alignments):包含研究中检测到的所有病毒序列完整列表,含“alignments数量”(J列)、“MAPQ分数”(K列)、“keep”列(是否保留)、“reason”列(AF列,过滤原因,如“a10m5”表示alignments<10或MAPQ<5)等字段。
- 工作表2(OT1.2-Filtering rules):描述原始病毒比对数据的过滤规则。
- 工作表3(OT1.3-Viruses in cancer table):按文库类型划分的癌症病毒检测结果表。
适用场景
- 癌症病毒研究:分析人类癌症样本中检测到的病毒序列分布及特征。
- 病毒比对数据处理:参考原始比对过滤规则,优化病毒序列数据的筛选流程。
- 癌症文库类型分析:研究不同文库类型下癌症病毒的检测差异。
- 医疗数据结构化分析:基于表格数据开展癌症相关病毒的统计与关联研究。