SciQA基准数据集及RDF转储数据

数据集概述

本数据集包含SciQA基准的问题与查询数据,分为人工构建(一百条)和自动生成(两千四百六十五条)两类问题。提供JSON格式的问题/查询文件及RDF NTriples格式的转储文件,支持导入RDF引擎进行查询分析。

文件详解

该数据集包含两个压缩文件,具体说明如下: - 文件名称: SciQA-dataset.zip:压缩文件,内部包含JSON格式的问题与查询数据文件,涵盖人工构建和自动生成的问题集。 - 文件名称: ORKG RDF dump 14.02.2023.zip:压缩文件,包含2023年2月14日从ORKG系统导出的RDF NTriples格式数据,可导入Virtuoso端点或其他RDF引擎进行查询。

适用场景

  • 问答系统研究:用于科学领域问答模型的训练与评估
  • 语义网技术应用:测试RDF数据的查询与推理能力
  • 信息检索算法优化:针对科学问题的检索策略研究
  • 自然语言处理分析:探索科学问题分类及复杂查询处理方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 10.86 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。