找到1个数据集

标签: Snapshot_Twitter_2022

过滤结果
  • 马来语_英语双语社交媒体仇恨言论检测数据集

    2025年11月28日 30 128 8

    数据集概述 本数据集包含两万六千九百八十五条马来语和英语的社交媒体帖子,用于二元仇恨言论检测任务。数据来自五个公开来源,经预处理后标注为仇恨或非仇恨类别,语言分布均衡,适用于多语言及低资源仇恨言论检测模型的训练与评估。 文件详解 说明文档: README.txt:TXT格式,介绍数据集的基本信息、来源及文件结构。 数据文件:...
    packageimg