-
SciRAG_QA_Based_多领域科学封闭问题问答基准数据集
2026年2月9日 30 32 5
数据集概述 本数据集是用于科学问答(QA)系统基准测试的多领域封闭问题数据集,覆盖10个研究领域下的34个主题,包含108条人工标注的问答对,每条数据标注了答案类型、难度等级及带来源论文链接的黄金参考,可用于验证检索增强生成(RAG)系统在科学领域的性能。 文件详解 metadata.csv 文件格式:CSV...
-
DBpedia_Based_知识库问答问题与答案类型标注数据集
2026年1月29日 30 24 2
数据集概述 本数据集包含37279个基于DBpedia的知识库问答问题,以及对应的答案类别和类型列表。问题来源于QALD 1-9、LC-QuAD 1.0和SimpleDBpediaQA的训练与测试数据集,答案类型体系采用自ISWC 2020的SMART-task挑战标准,为知识库问答任务的模型训练与评估提供标注数据支持。 文件详解...
-
Stack_Exchange_Based_机器学习从业者最佳实践问答数据集_2021
2026年1月18日 30 20 1
数据集概述 本数据集包含Stack Exchange平台上与“机器学习”标签及“最佳实践”相关的问答内容,基于2021年3月Stack Exchange数据 dump 筛选而来,用于研究从业者讨论的机器学习最佳实践。数据涵盖问题和答案两类内容,以TXT、CSV、XLSX三种格式呈现,共6个文件。 文件详解 问题类文件...
-
DUDE_Competition_Based_ICDAR2023文档理解竞赛训练验证测试集真值标注数据
2026年1月3日 30 53 14
数据集概述 本数据集为ICDAR 2023 DUDE竞赛提供训练、验证和测试集的真值标注,包含41454条标注数据,覆盖4974份文档。数据分为训练集、验证集和测试集,测试集为盲测集(无真值答案),已去除重复数据。 文件详解 文件名称:2023-03-23_DUDE_gt_test_PUBLIC.json 文件格式:JSON 字段映射介绍:...



