孟加拉语多模态分类语料库

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

孟加拉语多模态分类语料库

数据集概述

该数据集为低资源语言场景下的孟加拉语多模态（图像-文本）分类任务构建，包含训练与测试相关文件，支持使用视觉语言模型（VLMs）、大型语言模型（LLMs）及Transformer模型进行评估，提供分类任务所需的标签、文本与图像路径关联数据。

文件详解

数据文件（CSV格式）：
train.csv：训练集数据文件，包含Label（标签）、Text（孟加拉语文本）、Image_path（图像路径）字段
test.csv：测试集数据文件，包含Label（标签）、Text（孟加拉语文本）、Image_path（图像路径）字段
压缩文件（ZIP格式）：
BMCC-Train.zip：训练集相关压缩文件
BMCC-Test.zip：测试集相关压缩文件

适用场景

低资源语言多模态分类模型训练与评估
孟加拉语视觉语言模型（VLMs）性能测试
多模态Transformer模型在小语种场景下的适配研究
图像-文本关联任务的跨语言迁移学习分析

数据与资源

htpk9y2pwf-2.zipZIP
133.65 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	133.65 MiB
最后更新	2025年11月28日
创建于	2025年11月28日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？