-
孟加拉地区方言仇恨言论检测数据集BIDWESH
2025年11月28日 30 179 12
数据集概述 该数据集是首个针对孟加拉地区方言(诺阿卡利、吉大港、巴里萨尔)的仇恨言论检测基准语料库,含九千一百八十三个手动翻译标注实例,覆盖仇恨/非仇恨标签及十三类仇恨类型、七类目标群体,支持低资源方言语境下的多维度分析。 文件详解 BIDWESH...
-
BOISHOMMO_标准化多标签孟加拉语仇恨言论数据集
2025年11月28日 30 25 8
数据集概述 该数据集是针对低资源语言孟加拉语的多标签仇恨言论分析资源,含2499条社交媒体评论,覆盖10个仇恨类别,标注经多数投票确定,含英文翻译,支持跨语言研究,突出标签不平衡性,适用于模型鲁棒性测试与不平衡分析。 文件详解 文件名称:BOISHOMMO Dataset.zip 文件格式:ZIP压缩包(.zip)...
-
BOISHOMMO_多标签孟加拉语仇恨言论数据集
2025年11月26日 30 133 34
数据集概述 该数据集针对孟加拉语等低资源语言缺乏仇恨言论数据集的问题,构建了包含两千余个标注样本的多标签仇恨言论数据集BOISHOMMO,覆盖种族、性别、宗教、政治等类别,支持孟加拉语仇恨言论检测研究。 文件详解 文件名称:Bengali Heatspeech dataset.csv 文件格式:CSV(.csv)...



