数据集

WinoBias性别偏见解决Winograd模式数据集

WinoBias性别偏见解决Winograd模式数据集数据来源：互联网公开数据标签：性别偏见,共指解析,Winograd模式,自然语言处理,计算语言学,文本分析数据概述：本数据集设计用于共指解析任务，即确定文本中两个实体是否指代同一事物。该数据集特别关注性别偏见问题，包含以Winograd模式编写的句子，句子中的实体通过职业来指代（如护士、医生、木匠）。通过解析这些句子中的共指关系，可以更好地理解性别偏见在语言中的表现形式，并为消除这种偏见提供支持。数据用途概述：该数据集适用于性别偏见检测、共指解析研究以及Winograd模式分析等多种场景。研究人员可以利用此数据集进行自然语言处理任务的研究；教育机构可以将其用于教学演示；开发者可以利用这些数据集训练和评估模型。字段定义： - part_number：文本部分编号（数值型） - word_number：文本中单词编号（数值型） - tokens：分词后的单词（字符串） - pos_tags：单词的词性标注（字符串） - parse_bit：指示单词是否在解析树中的二进制值（数值型） - predicate_lemma：单词谓词的词干形式（字符串） - word_sense：单词的词义（字符串） - speaker：单词的说话人（字符串） - ner_tags：单词的命名实体识别标签（字符串） - verbal_predicates：单词的谓词（字符串） - coreference_clusters：单词的核心指代簇（字符串）

数据与资源

WinoBias性别偏见解决Winograd模式数据集.zipZIP
0.13 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.13 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

WinoBias性别偏见解决Winograd模式数据集

数据与资源

附加信息

注册成功！