仇恨言论检测模型性能评估数据集

仇恨言论检测模型性能评估数据集 数据来源:互联网公开数据 标签:仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试

数据概述: 本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。 数据集包含3728个经过验证的测试案例,涵盖了29种功能测试。 其中,19种功能测试对应于不同类型的仇恨言论,另外11种功能测试则涵盖了具有挑战性的非仇恨言论类型。

数据用途概述: 该数据集主要用于仇恨言论检测模型的诊断性评估,帮助研究人员深入了解模型在不同类型仇恨言论和非仇恨言论上的表现。 通过分析模型在不同功能测试中的表现,可以发现模型存在的偏见、局限性和薄弱环节,从而指导模型优化和改进。 此外,该数据集也适用于自然语言处理相关研究,例如提升文本分类模型的鲁棒性、探索不同类型的仇恨言论特征等。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.08 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。