数据集概述
本数据集包含基于三个分类器融合的奥运会遗产新闻情感分析结果,覆盖2012年伦敦和2016年里约奥运会遗产相关的1271篇新闻。数据通过Google搜索获取,对新闻标题和正文分别进行情感分类,最终输出14个Excel文件,记录新闻的搜索排名、发布日期、链接、标题及对应的情感标签。
文件详解
- 文件名称:按奥运会(伦敦/里约)和新闻媒体命名(如rio_theguardian.xlsx、london_dailymail.xlsx等),共14个.xlsx文件
- 文件格式:XLSX
- 字段映射介绍:
- Rank:新闻在Google搜索结果中的排名
- Date:新闻发布日期(DD/MM/YYYY)
- Link:新闻链接
- Title:新闻标题
- Sentiment_Title:新闻标题的最终情感标签(Pos/Neg/Neutral/other)
- Sentiment_Text:新闻正文的最终情感标签(Pos/Neg/Neutral/other)
数据来源
Google搜索引擎获取的新闻数据,经Vader、Amazon训练BERT、Twitter训练BERT三个分类器融合分析
适用场景
- 奥运会遗产舆论分析:研究伦敦、里约奥运会遗产相关新闻的情感倾向及舆论趋势
- 新闻媒体情感偏向研究:对比不同媒体对奥运会遗产报道的情感差异
- 情感分类方法验证:分析多分类器融合及基于句子比例的情感分类方法效果
- 新闻传播效果研究:结合Google搜索排名,探究情感倾向对新闻传播的影响