BanglaAbuseMeme_Based_孟加拉语辱骂表情包分类标注数据集

数据集概述

本数据集为针对孟加拉语辱骂表情包分类任务构建的标注数据集,包含从网络获取的4000个数据点。旨在解决低资源语言环境下孟加拉语辱骂表情包检测模型缺乏基准数据的问题,支持相关AI模型的训练与评估,助力社交媒体平台的在线安全治理。

文件详解

  • 文件名称:BanglaAbuseMeme.zip
  • 文件格式:ZIP(压缩包)
  • 字段映射介绍:压缩包内包含标注的孟加拉语辱骂表情包数据集,具体字段信息需解压后查看,未提供README或内容预览,推测包含表情包图像文件及对应的分类标签(如是否为辱骂类)。

数据来源

论文“BanglaAbuseMeme: A Dataset for Bengali Abusive Meme Classification”

适用场景

  • 社交媒体辱骂内容检测模型训练: 用于训练和评估孟加拉语辱骂表情包的自动分类AI模型,提升在线内容审核效率。
  • 低资源语言NLP与多模态研究: 支持孟加拉语等低资源语言环境下,多模态(图像+文本)内容分类的技术研究。
  • 在线安全治理应用: 为社交媒体平台提供辱骂表情包检测的基准数据,助力构建更安全的网络环境。
  • 跨语言辱骂内容检测迁移学习: 作为低资源语言的标注数据,为跨语言辱骂内容检测模型的迁移学习提供支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 470.68 MiB
最后更新 2026年1月20日
创建于 2026年1月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。