Kaggle维基百科周度网络流量数据集

数据集概述

该数据集是Kaggle维基百科网络流量预测竞赛日度数据集的周度聚合版本,包含十四万五千零六十三条时间序列,记录了2015年7月1日至2017年9月5日期间一组维基百科页面的周度访问量,原始缺失值已被替换为零后聚合。

文件详解

  • 文件名称: kaggle_web_traffic_weekly_dataset.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含周度网络流量时间序列数据,覆盖145063个维基百科页面,时间范围为2015-07-01至2017-09-05,原始缺失值已替换为零。

数据来源

Kaggle

适用场景

  • 时间序列预测研究: 用于开发和验证周度网络流量预测模型
  • 维基百科内容分析: 识别热门页面的访问量趋势和周期性模式
  • 竞赛数据复现: 支持对原Kaggle竞赛结果的复现与改进
  • 缺失值处理方法对比: 研究零值替换策略对时间序列分析的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 27.59 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。