数学中心Akademgorodok第一届研讨会有毒评论数据集

数据集概述

该数据集包含数学中心Akademgorodok第一届研讨会期间收集的带标签俄语有毒评论样本,数据来源于VK社交网络评论,标注了淫秽词汇存在、言语方向、道德信念三个维度,标注工作由专家社区代表指导完成。

文件详解

  • 文件名称: MCA Workshop - Toxic comments/combined.csv
  • 文件格式: CSV
  • 字段映射:
  • source: 评论来源链接
  • text: 评论文本(部分记录为空)
  • message: 评论内容
  • sex: 性别(如male)
  • decent: 是否含淫秽词汇(如obscene)
  • moral: 道德信念(如moral、immoral)
  • person: 人物标识(如person)

数据来源

VK社交网络

适用场景

  • 俄语有毒评论识别模型训练
  • 社交媒体内容安全监管研究
  • 网络言语道德倾向分析
  • 多维度文本标注方法论验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.22 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。