孟加拉语性别偏见检测多维度数据集

数据集概述

该数据集聚焦孟加拉语文本中的性别偏见检测,包含2451条标注数据,覆盖新闻、社交媒体等来源的句子或短语,标注了是否存在偏见、偏见类型及修正建议,为研究孟加拉语性别偏见提供结构化数据支持。

文件详解

  • 文件名称: A Multifaceted Approach to Gender Bias Detection in Bengali.csv
  • 文件格式: CSV
  • 字段映射:
  • ID: 序号
  • Text: 孟加拉语句子或短语
  • Label: 标注结果("Biased"或"Unbiased")
  • Gendered_Word: 引发偏见的词汇或短语(如有)
  • Bias_Type: 偏见类型(Stereotype/Occupational Bias/Honorific Bias/Pronoun Bias/Neutral)
  • Source: 文本来源(News/Social Media/Literature等)
  • Correction_Suggestion: 偏见中性化建议

适用场景

  • 自然语言处理研究:用于训练和评估孟加拉语性别偏见检测模型
  • 语言学分析:探究孟加拉语中性别偏见的语言表现形式
  • 社会科学研究:分析不同文本来源中的性别偏见分布特征
  • 语言工具开发:支撑孟加拉语无偏见语言生成或修正工具的构建
  • 文化传播研究:提升孟加拉语社区对语言偏见的认知与包容性实践
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。