数据集概述
本数据集包含美国和孟加拉国的COVID-19相关在线新闻报道,其中美国数据集含一千篇来自《华盛顿邮报》《星论坛报》的报道,孟加拉国数据集含五十篇来自《每日星报》《普罗托姆·阿洛报》的报道,为COVID-19新闻的NLP研究提供数据支持。
文件详解
- 文件名称: USA - Washington.csv:CSV格式,包含美国《华盛顿邮报》COVID-19新闻数据,字段有日期(Date)、链接(Link)、报纸名称(Newspaper Name)、标题(Headline)、报道内容(Report)
- 文件名称: USA - StarTribune.csv:CSV格式,包含美国《星论坛报》COVID-19新闻数据,字段同上
- 文件名称: Bangladesh - DailyStar.csv:CSV格式,包含孟加拉国《每日星报》COVID-19新闻数据,字段同上
- 文件名称: Bangladesh - Prothom_Alo.csv:CSV格式,包含孟加拉国《普罗托姆·阿洛报》COVID-19新闻数据,字段同上
- 文件名称: Covid_Dataset.pdf:PDF格式,为数据集说明文档
数据来源
GitHub(账户名NKK)
适用场景
- COVID-19新闻内容的主题建模与分析
- 新闻报道的情感倾向与态度研究
- 不同地区COVID-19相关新闻的对比分析
- 基于新闻文本的疫情数据提取与趋势预测
- NLP算法在COVID-19新闻处理中的应用测试