Jigsaw多语言恶意评论翻译测试数据集-多语言-英语

Jigsaw多语言恶意评论翻译测试数据集-多语言-英语 数据来源:互联网公开数据 标签:恶意评论,文本分类,多语言,翻译,Jigsaw,自然语言处理,机器学习,文本分析 数据概述: 本数据集是“Jigsaw多语言恶意评论分类”竞赛的原始测试集,包含6种语言的评论。为方便研究和分析,所有评论均已通过Yandex.Translate翻译成英文。数据集提供了经过翻译的英文评论及其对应的原始语言和标签信息,为跨语言的文本分析和恶意评论检测提供了重要的基础。 数据用途概述: 该数据集适用于多种研究和应用场景,包括但不限于:多语言恶意评论检测模型的训练和评估、跨语言文本分类、机器翻译质量评估、自然语言处理研究等。研究人员可以利用此数据集开发和测试多语言恶意评论检测算法,评估不同翻译方法对分类性能的影响,或者探索跨语言的文本分析技术。此外,该数据集也适用于教育和培训,帮助学习者理解多语言文本处理和恶意评论检测的实际应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 24.81 MiB
最后更新 2025年4月16日
创建于 2025年4月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。