找到1个数据集

标签: 测试运行记录

过滤结果
  • LLM一致性测试组合测试用例数据集

    2025年12月18日 30 135 18

    数据集概述 该数据集是用于大语言模型(LLM)一致性测试的组合测试用例集合,包含问题、同义词列表、覆盖数组、测试运行记录、模型输出及性能评估结果,支持分析Starling-LM、Llama系列等6个模型的响应一致性与准确性。 文件详解 核心问题文件:...
    packageimg