-
Flickr8k图像日语翻译数据集
Flickr8k图像日语翻译数据集 数据来源:互联网公开数据 标签:图像标注,日语翻译,机器翻译,图像识别,自然语言处理,图像描述,Flickr8k,多模态,文本数据 数据概述:... -
YouTube视频声音识别与分类数据集-VGG-Sound
YouTube视频声音识别与分类数据集-VGG-Sound 数据来源:互联网公开数据 标签:音频,视频,声音,YouTube,机器学习,计算机视觉,音频分类,声学,多模态,数据集 数据概述: VGG-Sound是一个音频-... -
多模态情感数据集
多模态情感数据集 数据来源:互联网公开数据 标签:多模态,情感分析,图像识别,自然语言处理,计算机视觉,图像分类,文本分析 数据概述: 本数据集包含100个不同类别动物和物体的图像及其对应的文本描述和情感标签,适用于多模态情感分析研究。图像类别包括鲨鱼、鸟类、蜥蜴、蜘蛛等。该数据集为计算机视觉和自然语言处理任务提供了丰富的数据资源。 数据用途概述:...