Kaggle维基百科每日网络流量数据集_含缺失值

数据集概述

本数据集是Kaggle维基百科网络流量预测竞赛所用数据,包含十四万五千零六十三条每日时间序列,记录2015年7月1日至2017年9月10日期间一组维基百科页面的点击量或网络流量数据,存在缺失值。

文件详解

  • 文件名称: kaggle_web_traffic_dataset_with_missing_values.zip
  • 文件格式: ZIP压缩包(.zip)
  • 内容说明: 压缩包内包含维基百科页面的每日网络流量时间序列数据,覆盖145063条记录,时间范围为2015-07-01至2017-09-10,数据存在缺失值,无训练/测试、数据/标签或原始/处理数据的拆分结构。

数据来源

Kaggle

适用场景

  • 时间序列预测研究: 用于训练和验证网络流量预测模型,探索缺失值处理方法
  • 维基百科用户行为分析: 分析不同页面的流量趋势、峰值规律及波动特征
  • 数据挖掘竞赛实践: 作为模拟竞赛数据集,供数据科学家练习预测任务
  • 缺失值插补算法验证: 测试各类缺失值填充技术在时间序列数据中的效果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 138.75 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。