-
SciRAG_QA_Based_多领域科学封闭问题问答基准数据集
2026年2月9日 30 151 27
数据集概述 本数据集是用于科学问答(QA)系统基准测试的多领域封闭问题数据集,覆盖10个研究领域下的34个主题,包含108条人工标注的问答对,每条数据标注了答案类型、难度等级及带来源论文链接的黄金参考,可用于验证检索增强生成(RAG)系统在科学领域的性能。 文件详解 metadata.csv 文件格式:CSV...
-
JailFact_Bench_LLM越狱攻击与幻觉分析基准数据集_SiMLA2025Workshop
2026年1月5日 30 56 20
数据集概述 本数据集是用于分析大语言模型(LLMs)越狱攻击与幻觉模式的基准数据集,包含语义对齐的越狱及事实性提示词,以及毒性变化、相似度得分、标注策略等元数据,支持LLM安全与事实一致性的评估研究。 文件详解 文件名称:README.md 文件格式:Markdown 字段映射介绍:包含数据集概述、开发背景、使用说明等文档内容...



