Kaggle用户国家及地区信息数据集-2019年-bwandowando
数据来源:互联网公开数据
标签:Kaggle,用户数据,地理位置,活跃度分析,社区参与
数据概述:
本数据集包含了Kaggle用户的国家和地区信息,旨在补充官方Meta-Kaggle数据集中缺失的地理位置数据。数据集通过用户ID与官方Users.csv文件中的数据关联,提供了用户的基本位置信息。需要注意的是,用户名和显示名称未包含在内,以保护用户隐私。
数据集涵盖的信息包括:
- 用户ID
- 国家
- 地区
数据收集过程中可能存在以下限制:
1. 部分用户未在个人信息中填写地理位置,导致部分数据缺失。
2. 部分用户在数据收集后更新了他们的地理位置信息,造成数据不一致。
活跃度定义:
- 接收到论坛、数据集或笔记本的点赞
- 给论坛、数据集或笔记本点赞
- 创建论坛主题、论坛帖子、笔记本或数据集
- 参与竞赛提交
- 存在于Meta-Kaggle的用户数据集中
数据截止日期为2019年1月1日。
更新信息:
2024年2月15日 - 由于Kaggle用户个人资料页面的更新,导致当前的抓取工具无法正常工作。UI布局发生变化后,我们将尽快修复相关问题。
数据用途概述:
该数据集适用于用户活跃度分析、社区参与研究、地区性用户分布研究等多种场景。研究人员可以利用该数据了解不同地区Kaggle用户的活跃情况;教育机构和组织可以借助数据制定地区性的教育和培训计划;政策制定者可以基于数据评估社区参与度和用户增长趋势。此外,该数据集也适合用于教育培训,帮助学习者理解Kaggle社区的动态发展规律。