巴西新闻标题情感分析数据集

巴西新闻标题情感分析数据集 数据来源:互联网公开数据 标签:巴西,新闻,情感分析,政治,媒体倾向,舆论分析,关键词提取,时间序列分析,数据抓取

数据概述: 本数据集收录了2021年以来巴西多家新闻机构发布的包含特定关键词的新闻标题及其情感分析结果。数据集涵盖的新闻机构包括UOL、Folha de São Paulo、O Antagonista、G1、R7、Senso Incomum和Terça Livre。关键词主要涉及巴西现任及前任总统、州长、部长等政治人物。新闻标题首先被翻译成英文,然后使用Google的自然语言API对英文和葡萄牙文标题进行情感分析。数据集还包括每个标题的首次在线时间、最后在线时间、总在线时间及当前是否在线等信息。

数据用途概述: 本数据集适用于分析不同新闻机构对特定政治人物的态度及其新闻发布策略。研究人员可以通过情感分析识别哪些媒体更倾向于支持或批评特定的政治人物,或者在特定时间段内发布特定情感倾向的新闻。此外,数据集还可用于评估新闻标题的在线持续时间和传播效果,帮助理解新闻界在不同政治事件中的反应模式。数据集也适合用于教育培训,帮助学习者了解媒体分析和情感计算的基本方法。

举例: 数据集中包含一个新闻标题及其情感分析结果的示例。例如,标题“Bolsonaro criticado por falta de liderança em meio à pandemia”(博索纳罗因应对疫情不力而受批评)最初来自Folha de São Paulo,首次在线时间为2021年3月10日14时,最后在线时间为2021年3月11日09时,总在线时间为17小时。情感分析结果显示,该标题在英文和葡萄牙文版本中均被判定为负面情感。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.79 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。