-
多模态生物医学竞赛排行榜数据集MultimodalBiomedicalCompetitionLeaderboard-josecarmona
多模态生物医学竞赛排行榜数据集MultimodalBiomedicalCompetitionLeaderboard-josecarmona 数据来源:互联网公开数据 标签:生物医学, 多模态, 竞赛, 排行榜, 机器学习, 评估指标, 团队表现, 成绩排名 数据概述:... -
多模态幽默问答训练数据集MultimodalHumorQuestionAnsweringTrainingDataset-huynguyen24
多模态幽默问答训练数据集MultimodalHumorQuestionAnsweringTrainingDataset-huynguyen24 数据来源:互联网公开数据 标签:多模态, 幽默, 问答, 文本理解, 图像理解, 知识推理, 情感分析, 自然语言处理 数据概述:... -
商品图片文本描述数据集ProductImageTextDescriptionDataset-chiayinlee
商品图片文本描述数据集ProductImageTextDescriptionDataset-chiayinlee 数据来源:互联网公开数据 标签:商品识别, 图像识别, 文本描述, 多模态, 机器学习, 自然语言处理, 图像文本匹配, 电商 数据概述:... -
图像-文本多模态泰国旅游场景数据集Image-TextMultimodalThaiTravelDataset-shinupizza
图像-文本多模态泰国旅游场景数据集Image-TextMultimodalThaiTravelDataset-shinupizza 数据来源:互联网公开数据 标签:图像识别, 文本描述, 多模态, 泰国旅游, 图像标注, 机器翻译, 深度学习, 自然语言处理 数据概述: 该数据集包含来自互联网的泰国旅游场景图像及其对应的泰语描述文本。主要特征如下:... -
情绪文本图像对应数据集EmotionTextImageCorrespondence-mizanurrahmanrafi
情绪文本图像对应数据集EmotionTextImageCorrespondence-mizanurrahmanrafi 数据来源:互联网公开数据 标签:情绪分析, 图像识别, 文本情感, 多模态, 情感分类, 图像文本匹配, 自然语言处理, 计算机视觉 数据概述: 该数据集包含文本描述与对应图像,记录了与情绪相关的文本内容及其视觉表达。主要特征如下:... -
社交媒体内容情感分析数据集SocialMediaContentSentimentAnalysis-rakibullah
社交媒体内容情感分析数据集SocialMediaContentSentimentAnalysis-rakibullah 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 图像识别, OCR, 多模态, 恶意内容检测, 舆情分析 数据概述:... -
情感分析多模态MOSI数据集SentimentAnalysisMultimodalMOSIDataset-yutian6241
情感分析多模态MOSI数据集SentimentAnalysisMultimodalMOSIDataset-yutian6241 数据来源:互联网公开数据 标签:情感分析, 多模态, 情绪识别, 文本分析, 语音识别, 视频分析, MOSI, 机器学习 数据概述: 该数据集包含来自MOSI(Multimodal Opinion Sentiment and... -
图像文字识别多模态数据集ImageTextRecognitionMultimodalDataset-mdiciohack
图像文字识别多模态数据集ImageTextRecognitionMultimodalDataset-mdiciohack 数据来源:互联网公开数据 标签:图像识别, 文字识别, 目标检测, 多模态, 数据标注, 计算机视觉, 深度学习, OCR 数据概述:... -
情感识别IEMOCAP语音数据集EmotionRecognitionIEMOCAPSpeechDataset-cynddia
情感识别IEMOCAP语音数据集EmotionRecognitionIEMOCAPSpeechDataset-cynddia 数据来源:互联网公开数据 标签:情感分析, 语音识别, 情感识别, 多模态, 语音情感, 情感标注, 机器学习, 深度学习 数据概述: 该数据集包含来自IEMOCAP(Interactive Emotional Dyadic... -
图像描述生成Flickr30K数据集ImageCaptioningFlickr30KCaptions-dujejdjd
图像描述生成Flickr30K数据集ImageCaptioningFlickr30KCaptions-dujejdjd 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像标注, 文本生成, 多模态, 数据集, 深度学习 数据概述:... -
阿拉伯语语音情感识别数据集ArabicSpeechEmotionRecognitionDataset-yehiahany
阿拉伯语语音情感识别数据集ArabicSpeechEmotionRecognitionDataset-yehiahany 数据来源:互联网公开数据 标签:语音识别, 情感分析, 阿拉伯语, 语音情感, 声音信号处理, 机器学习, 多模态, 音频数据 数据概述:... -
-
图像产品关键信息提取数据集-lameesmohamedmohee
图像产品关键信息提取数据集-lameesmohamedmohee 数据来源:互联网公开数据 标签:图像识别,产品信息提取,数据集,深度学习,计算机视觉,自然语言处理,信息抽取,多模态 数据概述: 该数据集包含图像和对应的产品关键信息,旨在用于图像中的产品信息提取任务。主要特征如下: 时间跨度:数据无明确的时间范围,主要关注产品图像和对应信息。... -
亚马逊多模态视觉语言模型数据集AmazonMultimodalVisionLanguageModelDataset-resnicksingh
亚马逊多模态视觉语言模型数据集AmazonMultimodalVisionLanguageModelDataset-resnicksingh 数据来源:互联网公开数据 标签:多模态,视觉语言,数据集,图像识别,自然语言处理,机器学习,人工智能,亚马逊 数据概述:... -
YouTube视频分类数据集YouTubeClassificationDataset-nameerkhanjh
YouTube视频分类数据集YouTubeClassificationDataset-nameerkhanjh 数据来源:互联网公开数据 标签:视频分类,数据集,机器学习,内容分析,自然语言处理,情感分析,多模态,人工智能 数据概述: 该数据集包含来自YouTube平台的视频数据,记录了视频的分类标签,内容描述,评论等信息。主要特征如下:... -
土耳其手语手势识别数据集TurkishSignLanguageHandmarksDataset-yemce55
土耳其手语手势识别数据集TurkishSignLanguageHandmarksDataset-yemce55 数据来源:互联网公开数据 标签:手语识别,计算机视觉,数据集,深度学习,视觉识别,人工智能,土耳其语,多模态 数据概述: 该数据集包含土耳其手语的手势标记数据,记录了土耳其手语的各种手势及其对应的标记信息。主要特征如下:... -
视频嵌入数据集GetVideoEmbeddingsData-garvk123
视频嵌入数据集GetVideoEmbeddingsData-garvk123 数据来源:互联网公开数据 标签:视频分析,数据集,嵌入,机器学习,计算机视觉,视频检索,自然语言处理,多模态 数据概述: 该数据集包含视频及其对应的嵌入向量,旨在用于视频分析,理解和检索任务。主要特征如下:... -
数据2024年多模态医学影像数据集MM24-nickb1125
2024年多模态医学影像数据集MM24-nickb1125 数据来源:互联网公开数据 标签:医学影像,多模态,数据集,机器学习,图像分析,肿瘤检测,诊断,放射学 数据概述: 该数据集包含来自2024年多模态医学影像挑战赛(MM24)的数据,旨在促进多模态医学影像分析的研究。主要特征如下: 时间跨度:数据记录的时间跨度为2024年。... -
情感分析视频数据集-rahulthakur20
情感分析视频数据集-rahulthakur20 数据来源:互联网公开数据 标签:情感分析,视频,数据集,自然语言处理,计算机视觉,机器学习,情绪识别,多模态 数据概述: 该数据集包含用于情感分析任务的视频数据,记录了视频内容及对应的情感标签。主要特征如下: 时间跨度:数据集的时间跨度不固定,取决于具体视频内容。... -
语言模型与视觉识别技术评测数据集LLaVA-EN-TRDataset-fatihemirguler
语言模型与视觉识别技术评测数据集LLaVA-EN-TRDataset-fatihemirguler 数据来源:互联网公开数据 标签:语言模型,视觉识别,数据集,多模态,机器学习,自然语言处理,人工智能,评测数据 数据概述: 该数据集包含来自语言模型与视觉识别技术评测项目的数据,记录了多模态场景下的图像与文本配对信息。主要特征如下:...