印度尼西亚评论情感分析训练数据集2023

印度尼西亚评论情感分析训练数据集2023 数据来源:互联网公开数据 标签:评论分析,情感分类,毒评检测,训练数据,机器学习,自然语言处理 数据概述: 本数据集是基于“jigsaw毒评分类挑战”训练数据进行修改而成,旨在用于评论情感分析和毒评检测的训练。数据集中包含了经过计算的“toxic_score”字段,该字段综合考虑了评论的毒性、极端毒性、侮辱、威胁、辱骂和身份仇恨等多个维度,为每条评论打分。数据集通过1:10的比例选取正负样本,并特别选取了1:5的难负样本,以提高训练模型的鲁棒性。 数据用途概述: 该数据集适用于自然语言处理和机器学习领域中的评论情感分析和毒评检测任务。研究人员可以利用此数据集训练和评估模型的性能;社交媒体平台可以使用模型来过滤和管理毒评;教育机构可以利用数据集进行相关课程的教学和研究。数据集还适用于评估和改进现有的评论分类模型,以提高其在处理真实世界评论数据时的准确性和鲁棒性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 36.8 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。