-
开放图片描述数据集CaptionsDatasetPublic-mahipalimkar
开放图片描述数据集CaptionsDatasetPublic-mahipalimkar 数据来源:互联网公开数据 标签:图像描述,自然语言处理,计算机视觉,数据集,文本生成,图像识别,多模态学习,人工智能 数据概述: 该数据集包含了大量图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。... -
泰国图像描述数据集ThaiCaptionDataset-blacksilva
泰国图像描述数据集ThaiCaptionDataset-blacksilva 数据来源:互联网公开数据 标签:图像描述,计算机视觉,自然语言处理,数据集,机器学习,视觉识别,多模态学习,人工智能 数据概述: 该数据集包含来自泰国地区的图像及其对应的泰文描述文本,记录了图像内容与泰文描述之间的关联。主要特征如下:... -
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass 数据来源:互联网公开数据 标签:人工智能,生成式AI,数据集,机器学习,自然语言处理,图像生成,文本生成,多模态学习... -
CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223
CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223 数据来源:互联网公开数据 标签:文本生成,数据集,机器学习,自然语言处理,计算机视觉,多模态学习,图像描述,AI技术... -
用于音频字幕生成的2021发布版Clotho音频标注数据集
用于音频字幕生成的2021发布版Clotho音频标注数据集 数据来源:互联网公开数据 数据概述: 由芬兰坦佩雷大学(Tampere University)开发并维护,音频内容来源于 Freesound 平台(https://freesound.org),相关数据与标注遵循 Freesound 授权协议和 Tampere University...