印度开发者社区Reddit帖子数据集-2023年7月至今-avgeekgupta
数据来源:互联网公开数据
标签:Reddit,印度开发者,社区讨论,数据集,数据分析,机器学习,情感分析,主题建模,用户行为,趋势分析
数据概述:
本数据集包含自2023年7月7日以来Reddit上r/developersindia社区的所有帖子信息。数据集旨在提供关于该社区讨论和活动的洞察,涵盖了帖子标题、内容、作者信息、投票情况、评论数量等关键要素。
数据集字段包括:
title:帖子标题
selftext:帖子内容(如果是文本帖子)
subreddit:子版块名称(r/developersindia)
author_flair_text:作者标签文本(如果有)
num_comments:帖子评论数量
downs:帖子收到的反对票数量
is_crosspostable:帖子是否可以交叉发布(True/False)
view_count:帖子浏览次数
ups:帖子收到的支持票数量
url:帖子关联的URL
is_video:帖子是否包含视频(True/False)
num_crossposts:帖子被交叉发布的次数
subreddit_subscribers:r/developersindia子版块的订阅者数量
author:帖子作者用户名
treatment_tags:应用于帖子的特殊标签或标记
all_awardings:帖子收到的任何奖项信息
media:与帖子关联的媒体内容信息
数据用途概述:
该数据集适用于各种数据分析和机器学习任务,包括:
1. 对r/developersindia社区帖子的情感分析
2. 主题建模以识别常见讨论话题
3. 用户行为分析,如帖子频率和参与度
4. 探索帖子和评论中的趋势和模式
5. 研究支持票、反对票和交叉发布的影响