数据集概述
本数据集包含2017年Reddit平台四个高活跃度心理健康子版块(Depression、SuicideWatch、Anxiety、Bipolar)的所有帖子、评论及元数据,以压缩包形式提供,可用于研究在线心理健康社区的用户内容与互动特征。
文件详解
- 压缩包文件
- 文件名称:MentalHealthSubreddits2017.zip
- 文件格式:ZIP
- 包含文件说明:解压后每个子版块对应三个Python Pickle文件,分别为:
- _post2data.pkl:以帖子ID为索引的字典,存储帖子关联数据(不含评论)
- _post2comments.pkl:以帖子ID为索引的字典,存储帖子对应的评论列表
- _comment2data.pkl:以评论ID为索引的字典,存储评论关联数据
数据来源
Reddit平台及http://files.pushshift.io/reddit
适用场景
- 心理健康在线社区分析:研究用户在不同心理健康子版块的内容发布与互动行为特征
- 用户情绪预测研究:基于帖子和评论数据,开发或验证用户情绪基调预测模型
- 社交媒体心理健康话题挖掘:分析2017年心理健康相关讨论的热点主题与趋势
- 在线心理健康干预参考:为设计针对抑郁、焦虑等群体的在线支持工具提供数据支撑