Reddit_MentalHealthSubreddits_2017年心理健康社区帖子评论数据

数据集概述

本数据集包含2017年Reddit平台四个高活跃度心理健康子版块(Depression、SuicideWatch、Anxiety、Bipolar)的所有帖子、评论及元数据,以压缩包形式提供,可用于研究在线心理健康社区的用户内容与互动特征。

文件详解

  • 压缩包文件
  • 文件名称:MentalHealthSubreddits2017.zip
  • 文件格式:ZIP
  • 包含文件说明:解压后每个子版块对应三个Python Pickle文件,分别为:
  • _post2data.pkl:以帖子ID为索引的字典,存储帖子关联数据(不含评论)
  • _post2comments.pkl:以帖子ID为索引的字典,存储帖子对应的评论列表
  • _comment2data.pkl:以评论ID为索引的字典,存储评论关联数据

数据来源

Reddit平台及http://files.pushshift.io/reddit

适用场景

  • 心理健康在线社区分析:研究用户在不同心理健康子版块的内容发布与互动行为特征
  • 用户情绪预测研究:基于帖子和评论数据,开发或验证用户情绪基调预测模型
  • 社交媒体心理健康话题挖掘:分析2017年心理健康相关讨论的热点主题与趋势
  • 在线心理健康干预参考:为设计针对抑郁、焦虑等群体的在线支持工具提供数据支撑
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 304.98 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。