Kremlin_Based_俄罗斯政府网站爬取总统讲话记录_1999_2019

数据集概述

本数据集为1999年12月31日至2019年12月31日期间从俄罗斯政府网站kremlin.ru爬取的文档集合,包含10,723份文档,覆盖总统讲话记录等内容,支持政府信息研究与文档分析。

文件详解

  • 主要数据文件
  • 文件名称:Kremlin.json、Kremlin.rds
  • 文件格式:JSON、RDS
  • 字段映射介绍:包含Id(格式Kremlin-1)、Id_no(数字格式)、Date(文档日期,格式YYYY-MM-DD)、Title(文档标题)、Text(含标题的文档全文)、URL(下载链接)、Downloaded(下载日期,格式YYYY-MM-DD)字段

数据来源

俄罗斯政府网站kremlin.ru

适用场景

  • 政府信息研究: 分析1999-2019年俄罗斯政府公开讲话的主题与内容趋势
  • 政治文本分析: 基于文档全文开展主题建模、关键词提取等文本挖掘工作
  • 历史事件溯源: 通过文档日期与内容对应特定历史时期的政府动态
  • 多语言文本处理: 针对俄语政府文档开展语言模型训练或翻译研究
packageimg

数据与资源

该数据集没有数据

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.0 MiB
最后更新 2026年1月19日
创建于 2026年1月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。