新冠演讲小型语料库2020

数据集概述

该数据集为新冠演讲小型语料库,包含伊曼纽尔·马克龙、佩德罗·桑切斯和安格拉·默克尔三位领导人的十五篇演讲,每位五篇。十四篇演讲时间为2020年3月至6月,每人均有一篇为同年10月或11月,内容和意图具有相似性。

文件详解

  • 演讲文件(共15个):
  • 文件格式:DOCX(.docx)
  • 命名规则:包含语言、演讲者姓名、序号及日期,如French_speech Macron_01 - 12.03.20.docx、Spanish_speech Sanchez_3 - 2020-04-18.docx、German_speech Merkel_05 - 26.11.20.docx
  • 元数据文件:
  • 文件名称:corona speeches mini corpus_meta file.pdf
  • 文件格式:PDF(.pdf)
  • 内容:可能包含语料库的元数据信息

适用场景

  • 自然语言处理研究:用于多语言文本分析、演讲内容相似度检测等NLP任务
  • 政治传播学研究:分析疫情期间不同国家领导人的演讲策略与公共沟通方式
  • 跨文化比较研究:对比法语、西班牙语、德语演讲中的疫情叙事差异
  • 时间序列分析:探究2020年不同阶段领导人对新冠疫情的表述变化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.61 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。