基于女性主义的孟加拉语辱骂性语言数据集

数据集概述

该数据集包含从Facebook、Instagram、Twitter等社交媒体平台收集的6830条孟加拉语评论,聚焦女性主义议题与性别相关讨论,由母语者手动标注为正面、负面(辱骂性)或中性,用于低资源语言的仇恨言论分析、辱骂语言识别等研究。

文件详解

  • 文件名称:Bengali Abusive Language Based on Feminism/all_data.csv
  • 文件格式:CSV
  • 字段说明:
  • Comment:孟加拉语评论内容
  • Label:情感标签(Positive/正面、Negative/负面、Neutral/中性)

适用场景

  • 自然语言处理研究:低资源语言(孟加拉语)的辱骂性语言识别模型训练与评估
  • 社交媒体内容分析:女性主义议题相关的在线性别骚扰语言模式研究
  • 社会语言学分析:数字平台中针对女性主义声音的辱骂性语言特征探究
  • 仇恨言论检测应用:支持孟加拉语环境下基于性别议题的仇恨言论过滤工具开发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.31 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。