-
AeroEngQA_Benchmark_航空工程飞机设计LLM评估基准数据集
2026年1月20日 30 41 17
数据集概述 本数据集是低体量、高质量的飞机设计问答(QA)基准数据集,用于支持大语言模型(LLMs)的定性评估。涵盖单跳可回答、单跳不可回答、多跳可回答、多跳不可回答四类问答场景,通过结构化文件提供航空工程领域的专业问答数据,为LLM在飞机设计任务中的性能评估提供标准基准。 文件详解 核心数据文件 文件名称:AeroEngQA_single-...
2026年1月20日 30 41 17