-
TFG系统评估大语言模型能力数据集
2025年12月7日 30 7 4
数据集概述 本数据集包含名为“通过文本摘要与扩展循环实现大语言模型能力评估系统”的学位论文(TFG)所用的结果、图表及评估文件,整体以压缩包形式存储,为研究大语言模型能力评估方法提供数据支持。 文件详解 文件名称: TFG-FILES.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
多模态大语言模型在物理概念测试的响应数据集2025
2025年12月6日 30 149 44
数据集概述 该数据集包含多款多模态大语言模型对四个物理概念测试(需图像解读)的完整响应,测试包括BEMA、TUG-K、QMVI和FTGOT,共一百零二题,每题提交十次,覆盖十五款模型的测试结果。 文件详解 文件名称:Polverini, Gregorcic - Data 2025-08-19.zip 文件格式:ZIP(压缩包)...



