孟加拉语文本分类研究数据集

孟加拉语文本分类研究数据集 数据来源:互联网公开数据
标签:孟加拉语,情感分析,毒性评论,文本分类,自然语言处理,多标签分类,社会媒体内容

数据概述:
本数据集整合了四个公开的孟加拉语文本数据集,旨在支持情感分析、毒性评论分类和孟加拉语新闻分类等研究。数据集包含标注的孟加拉语文本评论,覆盖多种情感类别和内容主题。数据集中包含23个不同的类别标签,涵盖情感(如积极、消极、中性)、毒性(如仇恨、侮辱、威胁)以及主题(如政治、宗教、体育、娱乐等)。数据集共包含约56,219条文本记录,每条记录均标注了详细的情感和内容标签。

数据用途概述:
该数据集适用于多种自然语言处理任务,包括情感分析、仇恨言论检测、多标签分类等。研究人员可利用此数据集进行模型训练和性能评估,探索孟加拉语文本处理的关键问题,如多标签分类、迁移学习、语境化文本分类等。此外,数据集还可用于社会媒体内容审核、公共情感分析、推荐系统开发等实际应用场景。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.54 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。