-
模型质量评估_人类评分_提示词_模型及LLM回答数据集
2025年12月19日 30 85 79
数据集概述 该数据集为论文《Assessing Model Quality Using Large Language Models》的配套数据,包含人类评分结果、提示词、模型数据及大语言模型(LLM)回答等内容,用于模型质量评估研究。 文件详解 PDF文档文件(共6个): Results LLM_M1.pdf、Results...
-
退税案例解释质量调查数据集
2025年12月15日 30 115 44
数据集概述 本数据集包含针对退税申请场景的解释质量感知(保真度与互操作性)调查相关文件,涵盖用户调查数据、实验设计文档、大语言模型(LLM)生成内容及评估材料,为研究退税场景下解释质量的感知与评估提供多维度数据支持。 文件详解 调查数据文件: data-survey.csv:CSV格式调查数据集,含128名用户对2个查询案例的评分 data-...
-
GerMedIQ德语医疗问诊问答语料库
2025年12月12日 30 72 61
数据集概述 该数据集包含四千五百二十四条德语医疗领域的模拟问答对,源自一百一十六个标准化问诊问题,由三十九名非患者参与者回答。问题提取自十二项基础问诊问卷及EORTC生活质量问卷等工具,同时包含十八个大中小型语言模型生成的零样本合成回答。 文件详解 根目录文件:Jhofenbitzer/GerMedIQ-...



