斯洛伐克共和国国民议会演讲数据集

斯洛伐克共和国国民议会演讲数据集 数据来源:互联网公开数据
标签:国民议会,斯洛伐克,政治分析,文本挖掘,政策研究,时间序列

数据概述:
本数据集包含斯洛伐克共和国国民议会(Narodná rada Slovenskej republiky, NRSR)会议中的演讲记录,数据来源于NRSR官方网页存档(http://tv.nrsr.sk)。数据集共收录了58,828篇演讲,时间范围从2010年5月26日至2018年3月13日。数据以JSON格式提供,每个记录包含以下字段:
- speaker(演讲者姓名)
- timestamp(演讲时间,ISO格式)
- speech(演讲文本)。

数据记录按时间戳从 newest 到 oldest 排序,文本采用UTF-8编码。演讲文本经过基本预处理,包括去除首尾空白字符和替换多余空格为单个空格。

数据用途概述:
该数据集适用于多种研究和分析场景,包括但不限于:
- 政治趋势分析:研究议员演讲内容的变化趋势,探讨政策议题的关注点。
- 政策制定支持:通过分析演讲内容,提取关键政策方向和公众关注点。
- 公共话语研究:探讨政治话语的演变及其与社会事件的关联。
- 自然语言处理:为文本挖掘、情感分析、主题建模等技术研究提供高质量的语料库。
- 教育培训:为政治学、社会学、语言学等领域的教学和研究提供数据支持。

研究人员和开发者可利用此数据集进行多维度分析,揭示政治生态和社会动态的深层规律。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 81.93 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。