PEQQS_Based_科学文献数量型问答检索全流程评估数据集

数据集概述

本数据集聚焦科学文献中的数量型抽取式问答场景,包含1031篇农业科学摘要的数量答案标注,以及基于39个查询的1130条查询-文档相关性判断。数据集支持信息检索与问答模块的端到端评估,可用于研究检索质量对下游问答结果的影响,尤其是大语言模型处理无关文档时的幻觉问题。

文件详解

  • quantities_ground_truth.json
  • 文件格式:JSON
  • 字段映射介绍:农业科学摘要的数量型答案标注数据,包含文档与对应抽取式数量答案的映射
  • qrels.txt
  • 文件格式:TXT
  • 字段映射介绍:查询-文档相关性判断数据,记录39个查询与对应文档的相关性评分
  • docs.json
  • 文件格式:JSON
  • 字段映射介绍:1031篇农业科学文献摘要的文本数据
  • topics.xml
  • 文件格式:XML
  • 字段映射介绍:39个数量型查询的元数据,包含查询内容等信息
  • document_IDs_PubAg.txt
  • 文件格式:TXT
  • 字段映射介绍:农业科学文献的PubAg平台文档ID列表

适用场景

  • 数量型抽取式问答模型评估: 用于测试模型从科学文献中提取特定数量答案的准确性
  • 检索增强生成效果研究: 分析检索质量对大语言模型问答结果(如幻觉问题)的影响
  • 信息检索系统优化: 基于查询-文档相关性判断数据,优化针对数量型需求的文献检索策略
  • 农业科学文献信息抽取: 辅助农业领域特定参数、指标等数量信息的自动化提取
  • 问答-检索全流程 pipeline 评估: 支持从文献检索到答案抽取的端到端系统性能验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 27.96 MiB
最后更新 2026年2月9日
创建于 2026年2月9日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。