Trawling_for_Trolling_Based_社交媒体骚扰类型标注数据集

数据集概述

本数据集包含12490行社交媒体内容样本,按仇恨言论、贬损内容、网络骚扰、亵渎内容和正常内容五类标注。数据主要来源于Twitter、Reddit和Wikipedia讨论页,无帖子元数据,可用于网络骚扰类型识别相关研究。

文件详解

  • 文件名称:Dataset_to_upload.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含社交媒体内容样本及对应的分类标签,标签类别为Hate Speech(仇恨言论)、Derogatory(贬损内容)、Trolling(网络骚扰)、Profanity(亵渎内容)、Normal(正常内容)

适用场景

  • 网络骚扰类型识别模型训练: 用于训练和验证社交媒体内容中仇恨言论、网络骚扰等不良信息的分类模型。
  • 社交媒体内容安全分析: 分析不同平台(Twitter、Reddit等)的不良内容分布特征。
  • 自然语言处理研究: 作为文本分类任务的基准数据集,支持不良信息检测算法的性能评估。
  • 网络生态治理研究: 为研究网络骚扰的类型、特征及治理策略提供数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.19 MiB
最后更新 2026年1月18日
创建于 2026年1月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。