印度拼图毒评强度与严重性增强数据集1963-2021

印度拼图毒评强度与严重性增强数据集1963-2021 数据来源:互联网公开数据 标签:文本增强,毒评检测,数据增强,自然语言处理,情感分析,机器学习,数据分析

数据概述: 本数据集用于增强初始的印度拼图(Jigsaw)数据集,特别针对毒评强度与严重性的分析。数据集来源于Davidson等人在2017年发表的《Automated Hate Speech Detection and the Problem of Offensive Language》,并融合了dataista0发布的简单朴素贝叶斯算法示例。数据集遵循MIT许可证,可供公开使用和修改。

数据用途概述: 该数据集适用于毒评检测、自然语言处理、情感分析以及机器学习研究等多种场景。研究人员可以通过分析增强后的数据集,评估不同模型在毒评识别上的准确性;同时,数据集也可用于探讨标注者间的一致性对毒评检测的影响,并将其应用于其他相关数据集。

举例: 数据集中包含经过增强处理的毒性评论样本及其对应的严重性评分,帮助研究者构建和训练更有效的毒评检测模型。例如,dataista0使用该数据集中的数据实现了简单的朴素贝叶斯分类器,识别出不同强度的毒性评论,从而提高了模型的预测性能。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 33.47 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。