WinoBias性别偏见解决Winograd模式数据集

WinoBias性别偏见解决Winograd模式数据集 数据来源:互联网公开数据 标签:性别偏见,共指解析,Winograd模式,自然语言处理,计算语言学,文本分析 数据概述: 本数据集设计用于共指解析任务,即确定文本中两个实体是否指代同一事物。该数据集特别关注性别偏见问题,包含以Winograd模式编写的句子,句子中的实体通过职业来指代(如护士、医生、木匠)。通过解析这些句子中的共指关系,可以更好地理解性别偏见在语言中的表现形式,并为消除这种偏见提供支持。 数据用途概述: 该数据集适用于性别偏见检测、共指解析研究以及Winograd模式分析等多种场景。研究人员可以利用此数据集进行自然语言处理任务的研究;教育机构可以将其用于教学演示;开发者可以利用这些数据集训练和评估模型。 字段定义: - part_number:文本部分编号(数值型) - word_number:文本中单词编号(数值型) - tokens:分词后的单词(字符串) - pos_tags:单词的词性标注(字符串) - parse_bit:指示单词是否在解析树中的二进制值(数值型) - predicate_lemma:单词谓词的词干形式(字符串) - word_sense:单词的词义(字符串) - speaker:单词的说话人(字符串) - ner_tags:单词的命名实体识别标签(字符串) - verbal_predicates:单词的谓词(字符串) - coreference_clusters:单词的核心指代簇(字符串)

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.13 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。