SM01_Web爬虫基准测试QES15与QES30实验结果数据集

数据集概述

该数据集包含SM01研究项目中QES15和QES30两个Web爬虫基准测试的实验结果,对比BF、PR、HITS和SM四种爬虫在塞尔维亚金属制造领域多语言网站子集上的性能,两个实验的单域名最大页面加载限制分别为15和30页。

文件详解

  • QES15_Sd_reports.zip:ZIP格式压缩包,可能包含QES15实验的详细报告文件
  • QES30_Sd_reports.zip:ZIP格式压缩包,可能包含QES30实验的详细报告文件
  • QES15_Sd_overview.ods:ODS格式表格,可能为QES15实验结果的概述数据
  • QES30_Sd_overview.ods:ODS格式表格,可能为QES30实验结果的概述数据
  • QES30_timeline_comparison_LS_LTSD_.ods:ODS格式表格,可能为QES30实验中不同爬虫时间线对比数据
  • CrawlReportContentGuide.pdf:PDF格式文档,报告文件内容指南,用于说明报告归档文件的结构与内容

适用场景

  • 网络爬虫算法性能对比研究:分析不同爬虫(BF、PR、HITS、SM)在多语言制造领域网站的爬取效率与效果
  • 基准测试实验分析:探究单域名最大页面加载限制对爬虫性能的影响
  • 多语言网页爬取技术优化:为制造业多语言网页的语义爬虫开发提供实验数据支持
  • 数据处理方法验证:验证原始数据处理场景下爬虫实验结果的可靠性与有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 107.53 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。