Loghub_2_0_日志解析大规模数据集集合

数据集概述

该数据集是Loghub-2.0项目下的日志解析大规模数据集集合,包含十四个压缩文件,覆盖Apache、Linux、HPC等不同系统或应用场景的日志数据,为日志解析技术研究提供基础数据支持。

文件详解

  • 压缩文件集合:共14个ZIP格式压缩文件,包含不同场景的日志数据
  • Apache.zip:Apache系统相关日志压缩文件,格式为ZIP
  • Proxifier.zip:Proxifier应用相关日志压缩文件,格式为ZIP
  • Linux.zip:Linux系统相关日志压缩文件,格式为ZIP
  • HPC.zip:高性能计算(HPC)相关日志压缩文件,格式为ZIP
  • Thunderbird.zip:Thunderbird应用相关日志压缩文件,格式为ZIP
  • OpenSSH.zip:OpenSSH服务相关日志压缩文件,格式为ZIP
  • Zookeeper.zip:Zookeeper系统相关日志压缩文件,格式为ZIP
  • Mac.zip:Mac系统相关日志压缩文件,格式为ZIP
  • 其他6个未列出名称的ZIP格式压缩文件,均为日志相关数据

数据来源

GitHub平台logpai/Loghub-2.0仓库

适用场景

  • 日志解析技术研究:用于日志解析算法的训练、测试与性能评估
  • 日志分析方法验证:为日志结构化、异常检测等分析方法提供实验数据
  • 计算机系统运维研究:支持系统日志相关的运维场景分析与模型构建
  • 学术研究数据支撑:为日志解析领域的学术论文提供实验数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 920.9 MiB
最后更新 2025年12月23日
创建于 2025年12月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。