瑞士新冠疫情主流媒体词汇与命名实体分析数据集

数据集概述

本数据集通过自定义解析器和自然语言处理(NLP)流程,分析2020年1月至2021年5月主流媒体中德、法、意、英四种语言的瑞士新冠疫情相关新闻,提取词汇(Lemmas)和命名实体的出现频率,反映疫情信息传播趋势。

文件详解

  • metadata.xlsx: Excel格式文件,包含新闻文章检索策略、数量等元数据信息
  • export.zip: 压缩包格式文件,可能包含NLP分析结果数据
  • it-NLP.pdf: PDF格式文件,可能为意大利语新闻的NLP分析报告或说明文档

数据来源

Factiva(道琼斯旗下新闻监测搜索引擎)

适用场景

  • 疫情信息传播研究:分析不同语言媒体对瑞士新冠疫情的报道重点与趋势
  • 媒体语言学分析:探究多语言环境下疫情相关词汇和实体的使用差异
  • 公共卫生传播研究:评估主流媒体疫情信息传播的内容特征与覆盖范围
  • 跨语言NLP应用:验证多语言文本分析模型在疫情新闻领域的适用性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 13.4 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。