-
开源对话式大语言模型西班牙语单词知识评估数据
2026年2月1日 30 168 61
数据集概述 本数据集包含一百个西班牙语词汇的开源对话式大语言模型认知评估数据,涵盖词汇使用频率、模型对词汇的认知情况、定义、例句及人工与自动验证结果。数据旨在评估不同开源大语言模型对西班牙语词汇的掌握程度,共包含十五个文件。 文件详解 词汇频率文件 文件名称:Frequencies_100_words_CREA.xlsx 文件格式:XLSX...
-
aspear_Source_SaferDecoding大语言模型对抗性提示防御微调数据集
2026年1月13日 30 69 33
数据集概述 本数据集用于微调模型以防御jailbreak攻击,是SafeDecoding的扩展。包含252条人类生成的原始对抗性种子提示(覆盖18个有害类别),以及Llama2、Vicuna、Dolphin、Falcon、Guanaco模型针对这些提示生成的拒绝请求的响应数据。 文件详解 文件名称:finetune.json 文件格式:JSON...
-
金融大语言模型Llama2生成问答数据集-1000条-yousefsaeedian
2025年4月22日 30 109 94
金融大语言模型Llama2生成问答数据集-1000条-yousefsaeedian 数据来源:互联网公开数据 标签:金融,问答,训练,教育,自然语言处理,模型评估,Llama2,债券,基金,货币对冲 数据概述: 本数据集包含1000条关于金融主题的问答对,利用Llama...



