找到3个数据集

标签: 多步推理

过滤结果
  • AeroEngQA_Benchmark_航空工程飞机设计LLM评估基准数据集

    2026年1月20日 30 178 122

    数据集概述 本数据集是低体量、高质量的飞机设计问答(QA)基准数据集,用于支持大语言模型(LLMs)的定性评估。涵盖单跳可回答、单跳不可回答、多跳可回答、多跳不可回答四类问答场景,通过结构化文件提供航空工程领域的专业问答数据,为LLM在飞机设计任务中的性能评估提供标准基准。 文件详解 核心数据文件 文件名称:AeroEngQA_single-...
    packageimg
  • 复杂序列问答数据集

    2025年12月13日 30 8 5

    数据集概述 该数据集聚焦复杂序列问答任务,结合知识图谱推理与对话系统能力,包含约二十万条对话及一百六十万轮次交互。问题需通过大规模知识图谱的复杂推理回答,涉及逻辑、定量及比较推理等场景,为相关模型研究提供支持。 文件详解 文件名称: CSQA_v9.zip 文件格式: ZIP(压缩包格式) 内容说明:...
    packageimg
  • 开放式问答数据集-高级问答研究数据集

    2025年4月14日 30 141 84

    开放式问答数据集-高级问答研究数据集 数据来源:互联网公开数据 标签:问答,自然语言处理,多步推理,常识知识,文本理解,机器学习,人工智能,OpenBookQA,数据集 数据概述:...
    packageimg