ANUBHUTI孟加拉地区语言情感分析综合语料库

数据集概述

该数据集包含两千句从标准孟加拉语人工翻译为四种主要地区方言(吉大港、诺阿卡利、锡尔赫特、迈门辛)的文本,以政治、宗教及中性内容为主,采用双标注方案:主题标注(政治、宗教、中性)与情感标注(七种情绪)。

文件详解

  • 目录:ANUBHUTI A COMPREHENSIVE CORPUS FOR SENTIMENT ANA/
  • 文件列表:
  • ANUBHUTI_Translated_Texts.csv:CSV格式,包含标准孟加拉语及四种地区方言的平行翻译文本,字段示例:Standard Bangla、Chittagong、Noakhali、Sylhet、Mymenshingh
  • ANUBHUTI.csv:CSV格式,包含方言文本及标注信息,字段示例:Chittagong、Noakhali、Sylhet、Mymenshingh、Target(主题标注)、anger/contempt/disgust/enjoyment/fear/sadness/surprise(情感标注)

适用场景

  • 自然语言处理研究:用于孟加拉地区方言的情感分析模型训练与评估
  • 计算语言学研究:探索方言翻译与情感标注的交叉应用
  • 社会文化分析:分析孟加拉地区不同方言群体对政治、宗教议题的情感倾向
  • 多标签情感标注研究:验证双标注方案在区域语言情感分析中的有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.12 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。