-
MERMaid多模态反应挖掘提示与原始数据集
2025年12月24日 30 62 59
数据集概述 该数据集是MERMaid项目的配套数据,包含多模态反应挖掘任务中使用的提示词文件及Dataraider、KGWizard模块的原始响应文件,覆盖PDF处理相关的多模态数据挖掘内容。 文件详解 该数据集包含8个文件,具体说明如下: - prompts.zip:ZIP格式压缩文件,可能包含多模态反应挖掘任务中使用的提示词集合 -...
-
巴西中等教育考试问题数据集2010_2022
2025年12月23日 30 169 161
数据集概述 该数据集提取自巴西国家教育研究所(INEP)网站公开的ENEM考试试题,覆盖2010至2022年。数据包含考试题目文本、选项列表、年份、学科领域及正确答案,通过脚本处理PDF文件生成,为研究巴西中等教育考试内容提供结构化数据支持。 文件详解 文件名称: enem_questions.zip 文件格式: ZIP压缩包 核心字段映射:...
-
DUDE_Sample_Based_样本训练数据OCR_PDF处理完整数据
2025年12月16日 30 103 51
数据集概述 本数据集是DUDE平台的首个样本训练数据集,供挑战者搭建系统使用。包含OCR、PDF样本文件及数据集描述JSON文件,无目录结构,文件类型以压缩包为主。 文件详解 DUDE_sample_OCR.zip:ZIP格式压缩文件,可能包含用于OCR任务的样本数据...



