孟加拉语多模态分类语料库

数据集概述

该数据集为低资源语言场景下的孟加拉语多模态(图像-文本)分类任务构建,包含训练与测试相关文件,支持使用视觉语言模型(VLMs)、大型语言模型(LLMs)及Transformer模型进行评估,提供分类任务所需的标签、文本与图像路径关联数据。

文件详解

  • 数据文件(CSV格式):
  • train.csv:训练集数据文件,包含Label(标签)、Text(孟加拉语文本)、Image_path(图像路径)字段
  • test.csv:测试集数据文件,包含Label(标签)、Text(孟加拉语文本)、Image_path(图像路径)字段
  • 压缩文件(ZIP格式):
  • BMCC-Train.zip:训练集相关压缩文件
  • BMCC-Test.zip:测试集相关压缩文件

适用场景

  • 低资源语言多模态分类模型训练与评估
  • 孟加拉语视觉语言模型(VLMs)性能测试
  • 多模态Transformer模型在小语种场景下的适配研究
  • 图像-文本关联任务的跨语言迁移学习分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 133.65 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。