数据集

印度拼图毒评强度与严重性增强数据集1963-2021

印度拼图毒评强度与严重性增强数据集1963-2021 数据来源：互联网公开数据标签：文本增强,毒评检测,数据增强,自然语言处理,情感分析,机器学习,数据分析

数据概述：本数据集用于增强初始的印度拼图（Jigsaw）数据集，特别针对毒评强度与严重性的分析。数据集来源于Davidson等人在2017年发表的《Automated Hate Speech Detection and the Problem of Offensive Language》，并融合了dataista0发布的简单朴素贝叶斯算法示例。数据集遵循MIT许可证，可供公开使用和修改。

数据用途概述：该数据集适用于毒评检测、自然语言处理、情感分析以及机器学习研究等多种场景。研究人员可以通过分析增强后的数据集，评估不同模型在毒评识别上的准确性；同时，数据集也可用于探讨标注者间的一致性对毒评检测的影响，并将其应用于其他相关数据集。

举例：数据集中包含经过增强处理的毒性评论样本及其对应的严重性评分，帮助研究者构建和训练更有效的毒评检测模型。例如，dataista0使用该数据集中的数据实现了简单的朴素贝叶斯分类器，识别出不同强度的毒性评论，从而提高了模型的预测性能。

数据与资源

印度拼图毒评强度与严重性增强数据集1963-2021.zipZIP
33.47 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	33.47 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。