克罗地亚议会辩论语料库2003_2020

数据集概述

该数据集包含克罗地亚议会(Sabor)2003-2020年(五个完整任期)的清洁预处理辩论语料库,含超五十万篇演讲,及议员和政党元数据,为研究议会话语提供支持。

文件详解

  • 议会任期数据文件(RDS格式):
  • CRO_5_term_final.RDS、CRO_6_term_final.RDS、CRO_7_term_final.RDS、CRO_8_term_final.RDS、CRO_9_term_final.RDS:分别对应克罗地亚议会第5至第9任期的最终数据集,RDS格式便于R语言读取与分析
  • 编码手册文件(PDF格式):
  • CODEBOOK_CRO_corpus.pdf:语料库编码手册,说明辩论文本数据的结构与编码规则
  • CODEBOOK_CRO_parties.pdf:政党编码手册,解释政党相关元数据的定义与编码方式
  • CODEBOOK_CRO_mps.pdf:议员编码手册,涵盖议员信息的字段说明
  • 政党与议员元数据文件(XLSX格式):
  • Croatia_parties_final.xlsx:克罗地亚政党最终数据表,包含政党相关元数据
  • Croatia_MPs_final.xlsx:克罗地亚议员最终数据表,记录议员个人及所属政党信息

数据来源

Zenodo(基于输入中提到的迁移信息及DOI链接来源)

适用场景

  • 政治话语分析:研究克罗地亚议会不同任期内的议题讨论重点与话语特征
  • 政党政治研究:分析各政党在议会辩论中的立场差异与互动模式
  • 计算语言学应用:基于议会辩论语料开展文本分类、主题建模等NLP任务
  • 政治科学量化研究:结合议员元数据,探究议员个人特征与发言行为的关联
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 376.26 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。