推特疫苗接种情绪分析数据集-2006至2019年

推特疫苗接种情绪分析数据集-2006至2019年 数据来源:互联网公开数据 标签:推特,疫苗接种,情绪分析,社交媒体,数据分析,公共卫生,趋势分析

数据概述: 本数据集包含2006年至2019年11月30日期间,所有推特中包含关键词“vaccination”的推文记录。数据集不仅包括推文内容,还收集了推文的发布时间和发布者的地理位置(如提供)。此外,还下载了发布者的用户ID、关注者ID以及好友ID。关注者是指会接收该用户消息的用户,而好友是指该用户会接收消息的用户。通过这些信息,可以追踪用户之间的信息流动。数据集使用开源信息工具TWINT(https://github.com/twintproject)和Python算法进行收集。

与只能查询最近七天推文的开放Twitter Search API不同,TWINT允许收集跨越数年的推文样本。本数据集通过查询与疫苗接种相关的多个关键词,收集了从2006年至2019年11月30日的推文,并存储在一个汇总的CSV文件中。

数据用途概述: 该数据集适用于多种分析场景,包括主题建模、图分析、机器学习/深度学习建模、推特疫苗接种数据的描述性分析与流行病学数据的结合、模拟疫苗情绪变化对疫情爆发和疾病传播的影响、从关键影响力用户推文中提取高质量内容并用于训练LDA模型以分类其他用户、按地理位置进行主题建模、识别分裂性推文的过滤过程、以及开发一种迭代方法,基于现有高质量内容(顶级推文和顶级URL)识别新趋势并动态更新跟踪特定内容的关键词。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 09:27 (UTC)
创建于 五月 31, 2025, 09:26 (UTC)