NewsSR_Based_塞尔维亚新冠疫情早期新闻语料库_多格式版

数据集概述

本数据集为塞尔维亚主要日报及新闻门户网站在新冠疫情早期(2020年3月至9月)发布的疫情相关新闻文章语料库,含纯文本版及带完整元数据的XML版,还配套有公民元语言评论语料库Covid-NEWS-Comm-SR,另有斯洛文尼亚和克罗地亚的平行版本。

文件详解

  • 压缩文件1:
  • 文件名称:SR xml.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含带完整元数据的XML格式新闻文章语料,具体字段基于XML结构,含新闻内容及相关元数据信息
  • 压缩文件2:
  • 文件名称:SR txt.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含纯文本格式的新闻文章语料,为无格式标记的原始文本内容

数据来源

欧盟Horizon 2020研究与创新计划(资助协议编号:101038047)

适用场景

  • 危机话语研究:分析新冠疫情早期塞尔维亚新闻媒体中的危机话语特征与传播模式
  • 危机传播分析:探究疫情期间新闻媒体的信息传播策略及公众沟通效果
  • 语言学创新研究:研究疫情时期语言使用的变化与创新现象
  • 多语言对比研究:结合斯洛文尼亚、克罗地亚平行版本开展区域疫情语料的跨语言比较分析
  • 元语言评论分析:通过配套的公民评论语料库研究公众对疫情新闻的反馈与话语互动
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 37.9 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。