印度开发者社区Reddit帖子数据集-2023年7月至今-avgeekgupta

印度开发者社区Reddit帖子数据集-2023年7月至今-avgeekgupta 数据来源:互联网公开数据 标签:Reddit,印度开发者,社区讨论,数据集,数据分析,机器学习,情感分析,主题建模,用户行为,趋势分析

数据概述: 本数据集包含自2023年7月7日以来Reddit上r/developersindia社区的所有帖子信息。数据集旨在提供关于该社区讨论和活动的洞察,涵盖了帖子标题、内容、作者信息、投票情况、评论数量等关键要素。

数据集字段包括: title:帖子标题 selftext:帖子内容(如果是文本帖子) subreddit:子版块名称(r/developersindia) author_flair_text:作者标签文本(如果有) num_comments:帖子评论数量 downs:帖子收到的反对票数量 is_crosspostable:帖子是否可以交叉发布(True/False) view_count:帖子浏览次数 ups:帖子收到的支持票数量 url:帖子关联的URL is_video:帖子是否包含视频(True/False) num_crossposts:帖子被交叉发布的次数 subreddit_subscribers:r/developersindia子版块的订阅者数量 author:帖子作者用户名 treatment_tags:应用于帖子的特殊标签或标记 all_awardings:帖子收到的任何奖项信息 media:与帖子关联的媒体内容信息

数据用途概述: 该数据集适用于各种数据分析和机器学习任务,包括: 1. 对r/developersindia社区帖子的情感分析 2. 主题建模以识别常见讨论话题 3. 用户行为分析,如帖子频率和参与度 4. 探索帖子和评论中的趋势和模式 5. 研究支持票、反对票和交叉发布的影响

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.79 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。