数据集概述
本数据集收集了二零二零年一月十五日至七月三十一日(八月六日)期间,波兰互联网上新冠疫情相关的多平台媒体数据,包括人工标注的文章、推文、视频及评论,以及提取的代表性内容和社会实证研究数据,为研究波兰疫情期间的社会行为提供支持。
文件详解
- 人工标注内容文件:
- facebook_articles_lower_silesia.zip:包含下西里西亚地区一千四百四十九篇人工标注的文章或Facebook帖子,格式为压缩包
- twits_annotated.xlsx:包含一千条最热门推文的人工标注数据,格式为Excel,字段包括is_fake(分类与数值型)、主题及情感
- 未命名文件:包含该地区外一百一十一篇人工标注文本
- 提取的代表性内容文件:
- articles_till_06_08.zip:通过Eventregistry.org工具提取的五万七千三百零六篇波兰语代表性文章,主题为新冠病毒,格式为压缩包
- tweets_till_31_07_users.zip、tweets_till_31_07_text.zip:通过Twitter API提取的一百零一万五千一百九十九条波兰语#Koronawirus推文,格式为压缩包
- youtube_comments_till_31_07.zip、youtube_movies.csv:通过Google API收集的一千五百七十四条含关键词Koronawirus的YouTube视频及二十四万七千五百七十五条评论,格式分别为压缩包和CSV
- 社会实证研究文件:
- empirical_social_studies.csv:包含截至五月二十五日的二百四十四项波兰新冠疫情社会实证研究分析数据,格式为CSV,字段包括研究编号、学科、研究URL、主题分类等
适用场景
- 计算社会科学研究:分析波兰疫情期间社交媒体上的信息传播机制与公众行为
- 数字流行病学研究:探究媒体数据与疫情发展及防控策略的关联
- 虚假信息识别研究:基于标注数据开发和验证新冠疫情相关虚假信息检测模型
- 公众情绪分析:研究不同平台上波兰民众对新冠疫情的情感倾向与主题分布
- 社会科学元分析:整合社会实证研究数据,总结波兰疫情社会影响的研究成果