数据集 - 海数据

模型质量评估_人类评分_提示词_模型及LLM回答数据集

2025年12月19日 30 16 12

数据集概述该数据集为论文《Assessing Model Quality Using Large Language Models》的配套数据，包含人类评分结果、提示词、模型数据及大语言模型（LLM）回答等内容，用于模型质量评估研究。文件详解 PDF文档文件（共6个）： Results LLM_M1.pdf、Results...

ZIP

退税案例解释质量调查数据集

2025年12月15日 30 86 4

数据集概述本数据集包含针对退税申请场景的解释质量感知（保真度与互操作性）调查相关文件，涵盖用户调查数据、实验设计文档、大语言模型（LLM）生成内容及评估材料，为研究退税场景下解释质量的感知与评估提供多维度数据支持。文件详解调查数据文件： data-survey.csv：CSV格式调查数据集，含128名用户对2个查询案例的评分 data-...

ZIP

GerMedIQ德语医疗问诊问答语料库

2025年12月12日 30 172 106

数据集概述该数据集包含四千五百二十四条德语医疗领域的模拟问答对，源自一百一十六个标准化问诊问题，由三十九名非患者参与者回答。问题提取自十二项基础问诊问卷及EORTC生活质量问卷等工具，同时包含十八个大中小型语言模型生成的零样本合成回答。文件详解根目录文件：Jhofenbitzer/GerMedIQ-...

ZIP

找到3个数据集

模型质量评估_人类评分_提示词_模型及LLM回答数据集

退税案例解释质量调查数据集

GerMedIQ德语医疗问诊问答语料库

注册成功！