美国政治家社交媒体言论数据集
数据来源:互联网公开数据
标签:美国政治家,社交媒体,公众舆论,政治偏见,数据分析,政治传播,政治研究
数据概述:
本数据集收录了来自美国参议员及其他美国政治家的约5000条社交媒体消息。数据由CrowdFlower采集,并对消息内容进行了分类,包括受众(全国或选民)、偏见(中立/两党制或有偏见/党派)以及信息实质(信息性、媒体活动公告、攻击其他候选人等)。该数据集为研究现代美国的政治动态提供了宝贵的工具,特别适合探索不同受众中党派和中立/两党制的消息倾向。
数据用途概述:
该数据集适用于政治偏见分析、公众舆论研究、政治传播研究等多种场景。研究人员可以利用此数据进行受众分析、偏见研究以及信息实质分类,以了解不同政治消息的受众反应。此外,数据集也适合用于教育培训,帮助学习者理解政治传播的动态变化。
字段定义:
_golden (布尔值): 表示该行是否为黄金行。
_unit_state (字符串): 单元状态。
_trusted_judgments (整数): 该行的信任判断次数。
_last_judgment_at (时间戳): 最后一次判断的时间。
audience (字符串): 该帖子的目标受众(全国或选民)。
bias (字符串): 该消息传达的偏见类型(中立/两党制或有偏见/党派)。
orig__golden (布尔值): 表示该行是否为黄金行(来自原始注释集)。
audience_gold (字符串): 受众类型(来自原始注释集)。
bias_gold (字符串): 偏见类型(来自原始注释集)。
embed (字符串): 用于在社交媒体上嵌入的代码。
label (字符串): 基于其情感标签分配的标签。
message_gold (字符串): 唯一标签,对应受众和偏见的组合。
source (字符串): 提供信息的来源名称。
text (字符串): 每条帖子的实际文本内容。