英国议会辩论情感标签数据集

数据集概述

该数据集为英国议会辩论情感标签数据集,包含1997-2017年英国下议院129场辩论的1251个动议-演讲单元,涵盖国内外事务等多主题,每个单元含演讲文本、动议及情感极性标签、元数据,支持情感分析系统评估。

文件详解

  • 文档文件:
  • Annotation_Guidelines_v2.pdf:PDF格式,情感标签标注指南文档,说明手动标注规则与标准
  • 数据文件:
  • HanDeSeT.csv:CSV格式,核心数据文件,字段包括id(编号)、title(辩论标题)、motion(动议内容)、manual motion(手动动议情感标签)、govt/opp motion(基于动议提出者与政府关系的动议标签)、motion party affiliation(动议所属政党)、utt1-utt5(演讲文本片段)、manual speech(手动演讲情感标签)、vote speech(基于投票的演讲标签)、party affiliation(演讲者政党)、name(演讲者姓名)、rebellion %(演讲者反叛率)

数据来源

  • 英国议会开放许可证V3.0(Hansard transcript data)
  • Public Whip(speaker rebellion rates数据,基于Open Data Commons Open Database License)

适用场景

  • 情感分析模型训练与评估,验证模型在政治文本场景的性能
  • 议会辩论情感倾向研究,分析不同政党、演讲者的情感表达差异
  • 政治话语模式分析,探究动议与演讲情感极性的关联规律
  • 演讲者行为研究,结合反叛率分析情感表达与政治立场的关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.62 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。