-
越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi
2025年6月4日 30 115 114
越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi 数据来源:互联网公开数据 标签:图表问答,越南语,图像理解,自然语言处理,机器翻译,数据集,多模态,人工智能,ChartQA,Viet-ShareGPT-4o-Text-VQA 数据概述:... -
网络爬取图像及描述数据集
2025年5月31日 30 147 37
网络爬取图像及描述数据集 数据来源:互联网公开数据 标签:图像描述,网络爬取,计算机视觉,自然语言处理,多模态学习,图像理解,视觉分析,文本生成,数据清洗,数据增强 数据概述: 本数据集是一个从互联网公开数据中收集的大型图像-... -
视觉问答图像理解数据集-图像与自然语言结合-通用
2025年5月30日 30 119 86
视觉问答图像理解数据集-图像与自然语言结合-通用 数据来源:互联网公开数据 标签:视觉问答,图像理解,自然语言处理,计算机视觉,人工智能,图像,文本,问答,多模态,场景理解 数据概述: 本数据集是用于视觉问答(VQA,Visual Question Answering)任务的通用数据集。VQA... -
微软大规模多模态多语言模型升级数据集5ms-upgradeDataset-danicoronado00
2025年5月29日 30 193 66
微软大规模多模态多语言模型升级数据集5ms-upgradeDataset-danicoronado00 数据来源:互联网公开数据 标签:多模态,多语言,数据集,图像理解,文本生成,机器翻译,人工智能,深度学习 数据概述: 该数据集旨在提升微软大规模多模态多语言模型(5ms)的性能,涵盖了多种模态的数据和多种语言的文本。主要特征如下:... -
卡通图像字幕数据集CartoonImageCaptionDataset-hamzabousalih
2025年5月29日 30 182 90
卡通图像字幕数据集CartoonImageCaptionDataset-hamzabousalih 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,机器学习,图像理解,视觉识别,人工智能 数据概述: 该数据集包含来自卡通图像的字幕数据,记录了卡通图像与其对应的文字描述。主要特征如下:... -
开放图像2019视觉关系真值数据集OpenImages2019VisualRelationshipTruthDataset-hchaps
2025年5月29日 30 52 4
开放图像2019视觉关系真值数据集OpenImages2019VisualRelationshipTruthDataset-hchaps 数据来源:互联网公开数据 标签:计算机视觉,视觉关系,数据集,图像标注,深度学习,目标检测,图像理解,人工智能 数据概述: 该数据集由开放图像项目(Open... -
视觉问答训练验证数据集VisualQuestionAnsweringTrainingandValidationDataset-krtpat
2025年5月19日 30 188 4
视觉问答训练验证数据集VisualQuestionAnsweringTrainingandValidationDataset-krtpat 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 多模态学习, 图像识别, 数据集, 机器学习, 计算机视觉 数据概述:... -
视觉问答数据集VisualQuestionAnsweringDataset-shivdutta
2025年5月15日 30 14 10
视觉问答数据集VisualQuestionAnsweringDataset-shivdutta 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 深度学习, 多模态, 图像标注, 数据集, 机器学习 数据概述: 该数据集包含来自互联网的图像与对应问题的问答对,旨在用于视觉问答任务的训练和评估。主要特征如下:... -
视觉问答与场景图分析数据集VisualQuestionAnsweringandSceneGraphAnalysisDataset-ottodardouri
2025年5月15日 30 68 43
视觉问答与场景图分析数据集VisualQuestionAnsweringandSceneGraphAnalysisDataset-ottodardouri 数据来源:互联网公开数据 标签:视觉问答, 场景图, 图像理解, 自然语言处理, 知识图谱, 多模态学习, 数据集, 计算机视觉 数据概述:... -
视觉问答试点数据集VQAPilotDataset修订版V2Corrected-virajbagal
2025年5月15日 30 6 3
视觉问答试点数据集VQAPilotDataset修订版V2Corrected-virajbagal 数据来源:互联网公开数据 标签:视觉问答,数据集,图像理解,自然语言处理,人工智能,多模态学习,计算机视觉,认知推理 数据概述: 该数据集包含视觉问答任务的数据,旨在促进图像理解和自然语言处理的研究。主要特征如下:... -
视觉问答训练数据集VisualQuestionAnsweringTrainingDataset-krutikpatel12
2025年5月12日 30 84 25
视觉问答训练数据集VisualQuestionAnsweringTrainingDataset-krutikpatel12 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 图像识别, 深度学习, 数据集, 计算机视觉, 多模态 数据概述:... -
仇恨言论检测与多模态分析数据集HateSpeechDetectionandMultimodalAnalysisDataset-huynguyen24
2025年5月12日 30 23 1
仇恨言论检测与多模态分析数据集HateSpeechDetectionandMultimodalAnalysisDataset-huynguyen24 数据来源:互联网公开数据 标签:仇恨言论, 多模态, 文本分析, 图像理解, 社交媒体, 情感分析, 机器学习, 数据标注 数据概述:... -
社交媒体讽刺文本分析与多模态理解数据集SocialMediaSatiricalTextAnalysis-MultimodalUnderstandingDa...
2025年5月10日 30 104 93
社交媒体讽刺文本分析与多模态理解数据集SocialMediaSatiricalTextAnalysis-MultimodalUnderstandingDataset-huynguyen24 数据来源:互联网公开数据 标签:讽刺文本, 多模态, 文本分析, 图像理解, 社交媒体, 情感分析, 机器学习, 数据标注 数据概述:... -
多模态视觉问答推理评估数据集MultimodalVisualQuestionAnsweringReasoningEvaluationDataset-nhanvi
2025年5月10日 30 28 27
多模态视觉问答推理评估数据集MultimodalVisualQuestionAnsweringReasoningEvaluationDataset-nhanvi 数据来源:互联网公开数据 标签:视觉问答, 多模态, 图像理解, 推理能力, 评估, 机器学习, 自然语言处理, 深度学习 数据概述:... -
视觉问答数据集VisualQuestionAnsweringDataset-krupat
2025年5月1日 30 86 21
视觉问答数据集VisualQuestionAnsweringDataset-krupat 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 多模态, 图像标注, 问答系统, 机器学习, 数据集 数据概述: 该数据集包含用于视觉问答任务的数据,记录了图像、问题和答案之间的对应关系。主要特征如下:... -
越南语视觉问答数据集VietnameseVisualQuestionAnsweringDataset-ictworld
2025年4月29日 30 172 91
越南语视觉问答数据集VietnameseVisualQuestionAnsweringDataset-ictworld 数据来源:互联网公开数据 标签:视觉问答, 越南语, 自然语言处理, 图像理解, 多模态, 文本分析, 数据标注, 图像检索 数据概述: 该数据集包含来自越南语语料库的视觉问答数据,记录了关于图像的提问与答案。主要特征如下:... -
视觉问答数据集VisualQuestionAnsweringDataset-krutikpatel12
2025年4月29日 30 207 164
视觉问答数据集VisualQuestionAnsweringDataset-krutikpatel12 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 图像标注, 问答系统, 机器学习, 计算机视觉, 多模态学习 数据概述: 该数据集包含来自多个来源的视觉问答数据,用于评估模型在图像理解和自然语言处理方面的能力。主要特征如下:... -
视觉问答数据集VisualQuestionAnsweringDataset-phong2004
2025年4月29日 30 164 61
视觉问答数据集VisualQuestionAnsweringDataset-phong2004 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 图像识别, 深度学习, 多模态, 数据集, 计算机视觉 数据概述: 该数据集包含来自公开来源的视觉问答数据,旨在支持图像理解和视觉问答任务。主要特征如下:... -
图像描述生成英语文本数据集ImageCaptioningEnglishTextDataset-zeindea
2025年4月29日 30 26 2
图像描述生成英语文本数据集ImageCaptioningEnglishTextDataset-zeindea 数据来源:互联网公开数据 标签:图像描述, 文本生成, 计算机视觉, 自然语言处理, 机器翻译, 数据标注, 深度学习, 图像理解 数据概述: 该数据集包含来自互联网的图像描述数据,记录了图像与其对应的英文文本描述。主要特征如下:... -
视觉问答图像数据集VisualQuestionAnsweringImageDataset-piyushchavan2006
2025年4月29日 30 193 119
视觉问答图像数据集VisualQuestionAnsweringImageDataset-piyushchavan2006 数据来源:互联网公开数据 标签:视觉问答, 图像理解, 自然语言处理, 图像识别, 深度学习, 数据集, 问答系统, 计算机视觉 数据概述:...