数据集概述
本数据集收录了二零一六年至二零二零年间国际及孟加拉国媒体关于罗兴亚难民危机的新闻报道语料,包含新闻来源链接、媒体清单及编译后的纯文本语料,为多领域研究人员分析危机报道特征提供数据支持。
文件详解
该数据集按阶段划分文件,具体说明如下:
- 阶段一(NOW语料库)文件:
- Hyperlinks from NOW Corpus (Bangladesh).xlsx:Excel格式,包含孟加拉国媒体新闻链接
- Hyperlinks from NOW Corpus (International).xlsx:Excel格式,包含国际媒体新闻链接
- 阶段二(编译)- 来源文件:
- Int_Rohingya_News Website List.csv:CSV格式,国际罗兴亚新闻网站清单
- BD_Rohingya_URLs of Corpus.csv:CSV格式,孟加拉国罗兴亚新闻语料URL列表
- Int_Rohingya_URLs of Corpus.csv:CSV格式,国际罗兴亚新闻语料URL列表
- BD_Rohingya_News Website List.csv:CSV格式,孟加拉国罗兴亚新闻网站清单
- 阶段二(编译)- 纯文本语料:
- ( Rohingya) Bangladesh News Corpus.txt:TXT格式,孟加拉国媒体罗兴亚新闻纯文本语料
- ( Rohingya) International News Corpus.txt:TXT格式,国际媒体罗兴亚新闻纯文本语料
适用场景
- 新闻传播学研究:分析不同媒体对罗兴亚危机的报道框架与叙事差异
- 国际冲突研究:探究难民危机在国际舆论场中的呈现特征
- 难民危机管理:基于媒体报道数据识别危机应对的舆论需求
- 计算语言学应用:用于新闻文本分类、主题建模等自然语言处理任务