全球Top1000YouTube频道统计分析数据集-mabelhsu
数据来源:互联网公开数据
标签:YouTube,频道统计,订阅者,国家分布,内容类别,视频分析,数据清洗
数据概述:
本数据集包含全球排名前1000的YouTube频道的详细信息。原始数据来自COMPUTINGVICTOR - Top 1000 Youtubers statistics,但存在重复项和“国家”、“类别”列中的不准确数据。经过数据清洗和整理,该数据集更准确可靠,适用于进一步分析。
数据集内容包括以下字段:
- Rank:根据订阅者数量对YouTube频道进行排名。
- Username:YouTube频道的唯一标识符。
- Categories:频道可能涵盖的额外内容类别或类型。
- Subscribers:频道的订阅者数量。
- Country:频道所在国家。
- Visits:观众观看创作者视频的平均次数(保留原始数据集中的数值)。
- Likes:观众对频道视频点赞的平均次数(保留原始数据集中的数值)。
- Comments:观众在频道视频上留下的平均评论数(保留原始数据集中的数值)。
- Links:YouTube频道的URL链接。
方法论:
该数据集通过结合Google Sheets功能和YouTube Data API进行清洗,修正了不准确的数据。
- 移除了6个重复条目。
- 手动添加了6个频道,确保总频道数为1000。
- 使用YouTube Data API获取每个频道的“国家”和“类别”信息。
- 对于缺少国家信息的频道,通过手动研究确定内容创作者的主要位置。
数据用途概述:
该清洗后的数据集适用于多种分析场景,包括:
- 理解全球Top 1000 YouTube频道的国家分布。
- 分析点赞数、评论数与订阅者数量之间的相关性。
- 考察顶级频道的内容趋势。
致谢:
原始数据集来源于Kaggle上的Top 1000 YouTubers数据集。