数据集概述
本数据集为从俄罗斯外交部官网mid.ru抓取的2003年1月至2019年12月的新闻文件集合,包含部长讲话、副部长讲话、电话交谈、简报会等七类文件,共一万一千八百五十七份文档,每份文档对应一行数据,记录了文档的标识、日期、标题、类型、全文、来源链接等信息。
文件详解
- 数据文件
- 文件名称:
MID.rds
- 文件格式:RDS
- 字段映射介绍:包含ID、ID_no、Date、Title、Type、Text、URL、Downloaded等字段,记录文档的唯一标识、发布日期、标题、类型、全文内容、来源链接及下载日期
- 文件名称:
MID.json
- 文件格式:JSON
- 字段映射介绍:字段与RDS文件一致,以JSON格式存储文档的标识、日期、标题、类型、全文、来源链接及下载日期
- 说明文件
- 文件名称:
LICENSE
- 文件格式:无扩展名
- 内容介绍:俄罗斯外交部网站材料的使用许可说明,明确非商业使用规则及媒体引用要求
数据来源
俄罗斯外交部官网www.mid.ru
适用场景
- 外交政策研究:分析2003-2019年俄罗斯外交部官方文件,研究其外交立场和政策演变
- 文本内容分析:基于文档的标题、类型和全文,开展主题分类、关键词提取等文本挖掘工作
- 政府信息公开研究:探讨俄罗斯外交部新闻文件的发布规律和信息传播特征
- 历史事件关联分析:结合文档日期和内容,关联特定时间段的国际事件,研究官方回应逻辑