找到2个数据集

标签: 模型能力评估

过滤结果
  • TFG系统评估大语言模型能力数据集

    2025年12月7日 30 7 4

    数据集概述 本数据集包含名为“通过文本摘要与扩展循环实现大语言模型能力评估系统”的学位论文(TFG)所用的结果、图表及评估文件,整体以压缩包形式存储,为研究大语言模型能力评估方法提供数据支持。 文件详解 文件名称: TFG-FILES.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg
  • 多模态大语言模型在物理概念测试的响应数据集2025

    2025年12月6日 30 149 44

    数据集概述 该数据集包含多款多模态大语言模型对四个物理概念测试(需图像解读)的完整响应,测试包括BEMA、TUG-K、QMVI和FTGOT,共一百零二题,每题提交十次,覆盖十五款模型的测试结果。 文件详解 文件名称:Polverini, Gregorcic - Data 2025-08-19.zip 文件格式:ZIP(压缩包)...
    packageimg