-
BIRCO_Based_LLM系统评估用精选信息检索数据集
2026年1月30日 30 61 27
数据集概述 本数据集是经过精心整理的现有信息检索数据集集合,适用于基于大型语言模型(LLM)的系统评估。包含DORIS-MAE、ArguAna、WhatThatBook、Clinical-Trial和RELIC五个子数据集,每个子数据集均包含查询文本、语料库文本及查询相关性评分,支持LLM系统的检索性能评估。 文件详解...
-
孟加拉语语音识别测试集_重新审视Anwesha扩展金标准数据集
2026年1月28日 30 41 16
数据集概述 本数据集为孟加拉语信息检索(IR)测试集,扩展了现有黄金标准数据集,包含100个查询-文档相关性对及1000篇文档的新测试集。文档来源于Ebela、Zee News等新闻平台及旅游博客,支持不同复杂度查询的检索性能评估,是孟加拉语IR研究的基础资源。 文件详解 BSE_qrels.json 文件格式:JSON...
-
MTG_QBH_Based_哼唱检索实验数据集_完整数据_说明_1_因原数据未提及具体时间_所有文件名均采用_完整数据_默认后缀_2_核心锚点保留_MTG...
2025年12月23日 30 178 5
数据集概述 本数据集包含118条哼唱旋律录音,由17名不同音乐经验的受试者录制,用于哼唱检索(QBH)实验。录音无伴奏、无后期处理,模拟真实检索场景,附3个元数据文件描述查询及测试音乐集信息。 文件详解 文件名称: MTG-QBH.zip 文件格式: ZIP压缩包 包含内容: 118条哼唱查询录音文件 1个描述查询信息的元数据文件...



