全球新闻_灾害与恐怖袭击事件注释数据

数据集概述

本数据集包含两部分内容:一是6,468条新闻文章的标注数据,用于验证新闻是否与大语言模型识别的事件匹配(标签为0或1);二是包含(事件发生国、报道国)配对的数千条观测数据,涵盖相关国家因素、事件平均死亡人数及报道国对事件发生国的平均报道数量。数据集共2个压缩文件,用于支持新闻事件匹配及相关因素分析。

文件详解

  • 标注数据压缩包
  • 文件名称:ground_truth.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含6,468条新闻文章的标注记录,核心字段为新闻文章标识、事件匹配标签(1表示匹配,0表示不匹配)
  • 回归分析数据压缩包
  • 文件名称:regression_data.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含数千条(事件发生国、报道国)配对观测数据,核心字段为事件发生国、报道国、相关国家因素、事件平均死亡人数、报道国对该事件的平均报道数量

适用场景

  • 新闻事件匹配验证: 利用标注数据评估大语言模型识别灾难与恐怖袭击事件的准确性
  • 跨国家新闻报道模式分析: 通过(事件发生国、报道国)配对数据,研究不同国家对灾难与恐怖袭击事件的报道偏好
  • 事件影响因素研究: 分析国家因素、死亡人数等变量与新闻报道数量的关联
  • 新闻传播机制探索: 探究报道国与事件发生国的关系对新闻报道行为的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.99 MiB
最后更新 2026年2月15日
创建于 2026年2月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。