Reddit冠状病毒讨论数据集-2021-gpreda
数据来源:互联网公开数据
标签:冠状病毒,Reddit,社交媒体,讨论,公共卫生,疫情分析,公众意见
数据概述:
本数据集包含了来自Reddit论坛中Coronavirus子版块的帖子和评论数据。Coronavirus子版块是一个拥有超过240万订阅者的讨论区,用户在此交流与冠状病毒相关的各种话题。数据集中的内容通过使用Python Reddit API Wrapper (praw)从https://www.reddit.com/r/Coronavirus/收集而来。
数据集包含帖子和评论两类信息,每条记录均包括以下字段:
- title: 帖子标题(仅限帖子)
- score: 帖子得分(仅限帖子),基于帖子的影响和评论数量
- id: 帖子或评论的唯一标识符
- url: 帖子链接(仅限帖子)
- commns_num: 帖子下的评论数量(仅限帖子)
- created: 创建日期
- body: 帖子或评论的文本内容
- timestamp: 时间戳
数据用途概述:
该数据集适用于公共卫生研究、社会媒体分析、公众情绪监测以及疫情信息传播研究等多种场景。研究人员可以利用此数据了解公众对冠状病毒的看法和反应;政策制定者可以依据数据制定相应的应对措施;教育机构可以利用此数据进行社会媒体分析的教学。数据集为冠状病毒相关研究提供了丰富的文本数据资源。