越南语图表问答数据集-ChartQA与Viet-ShareGPT-4o-Text-VQA-nhanvi
数据来源:互联网公开数据
标签:图表问答,越南语,图像理解,自然语言处理,机器翻译,数据集,多模态,人工智能,ChartQA,Viet-ShareGPT-4o-Text-VQA
数据概述:
本数据集整合了两个越南语图表问答数据集,旨在促进越南语环境下的图表理解和视觉问答研究。数据集包含来自ChartQA的数据,该数据最初由LLAMA-405B模型翻译生成,以及来自5CD-AI/Viet-ShareGPT-4o-Text-VQA的数据。前者侧重于ChartQA的越南语翻译版本,后者则提供了越南语的图像和文本问答对。数据集结合了图表图像和越南语问题,并配有相应的答案,用于评估模型对图表内容的理解和回答问题的能力。
数据用途概述:
该数据集主要应用于多模态研究,特别是越南语环境下的图表理解和视觉问答(VQA)任务。研究人员可以利用此数据集训练和评估VQA模型,探索模型对图表内容的理解能力,包括数值提取、趋势分析、比较等。此外,该数据集也可用于开发越南语自然语言处理(NLP)和计算机视觉(CV)的交叉应用,促进越南语VQA技术的进步。该数据集还可用于教育和培训,帮助学习者理解VQA任务,以及提升对越南语的理解和应用能力。