COVID-19疫苗公众反应推特数据集
数据来源:互联网公开数据
数据集说明:
本数据集收集了与 Covishield 新冠疫苗 相关的推文文本,旨在支持自然语言处理(NLP)任务,如情感分析、主题提取、公众反应趋势研究等。Covishield 是由阿斯利康与牛津大学合作研发,并由印度血清研究所(Serum Institute of India)生产的新冠疫苗。
该数据集可用于了解公众对疫苗的接受度、担忧、支持或质疑的态度,特别是在疫情传播、疫苗推广和接种政策变化期间的社交舆论动态。
字段定义(如数据结构包含以下内容):
tweet_id:推文唯一标识符
username:发布者用户名(如提供)
timestamp:推文发布时间
text:推文内容文本
language:推文语言(如有)
location:用户定位(如有)
retweets:转发次数
likes:点赞次数
hashtags:推文中提及的标签(如 Covishield, COVID19, Vaccine 等)
数据特征:
类型:文本数据(非结构化)
来源:社交媒体平台(Twitter),以“Covishield”为关键词进行抓取
多语言支持可能性,适合多语言文本处理与分析
时间范围:视抓取时间而定,适合特定阶段的舆情研究(如疫苗刚推广、疫情高峰期等)
数据来源:Twitter 平台,基于关键词搜索方式采集
数据格式:CSV 或 JSON 格式,适用于 NLP 与文本挖掘任务
更新频率:静态快照(单次或阶段性抓取)
适用场景:
疫苗相关舆情分析
情感分类(正面、中性、负面)
社交网络中信息扩散研究
疫苗接受度与误解识别
话题建模与关键词提取(如LDA、TF-IDF)
标签:新冠疫苗,Covishield,Tweet数据集,社交媒体分析,NLP,情感分析,公众意见,话题建模,社交舆论,疫情数据