Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版

Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述: 本数据集是对Jigsaw多语言有毒评论分类竞赛原始数据集的增强版本。为了更好地应用于机器学习模型,该数据集对原始数据进行了三方面的改进:首先,将多种语言的评论翻译成英语,以便于基于英语的自然语言处理模型进行训练和测试;其次,为每条评论添加了情感分数,包括正面、负面、中性和复合情感值;最后,增加了英文翻译后评论的长度信息。 数据来源于Yury Kashnitsky数据集的评论翻译。 数据用途概述: 该数据集适用于文本分类、情感分析、多语言处理等多种研究场景。研究人员可以使用该数据集训练和评估有毒评论检测模型,探索不同情感分数对分类结果的影响,以及分析评论长度与毒性之间的关系。此外,该数据集也适用于自然语言处理领域的教学和实践,帮助学习者理解多语言文本处理和情感分析的应用。

packageimg

数据与资源

该数据集没有数据

附加信息

字段
版本 1.0
数据集大小 0.0 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。