-
BioASQ_Based_生物医学专家真实需求问答基准数据集
2026年1月29日 30 142 37
数据集概述 本数据集为BioASQ生物医学问答基准数据集,包含英文问题、标准参考答案及相关材料,反映生物医学专家真实信息需求,兼具挑战性与实用性。数据集融合结构化与非结构化数据,除精确答案外还包含理想答案(摘要形式),适用于问答系统、多文档摘要、信息检索等多任务研究,且随BioASQ挑战赛持续扩展。 文件详解 README文件 文件名称:README...
-
CLEVRER_Humans_Based物理事件因果判断视频推理基准数据
2026年1月21日 30 138 105
数据集概述 本数据集为CLEVRER-Humans基准,是包含人类标注的物理事件因果判断视频推理数据集。通过迭代事件完形填空任务生成因果事件图(CEGs),结合神经语言生成模型增强数据,将CEGs转换为问答对,包含视频、标注、问题及CEGs四部分内容,用于评估物理事件因果推理能力。 文件详解 README.md 文件格式:MD...
-
Eververse_Project_Based_数字时代诗歌与身份探索_数据集
2026年1月19日 30 155 20
数据集概述 本数据集来自2019-2020年的Eververse项目,该项目融合人文与科学视角,探索数字时代的诗歌及诗意身份。数据集包含诗人的生物特征数据(JSON格式,每日文件)和生成的完整诗歌文本(TXT格式,每月文件),用于支持项目的自动诗歌生成研究。 文件详解 eververse_biometric_data.zip 文件格式:ZIP...
-
大语言模型系统建模任务能力评估与改进数据集
2025年12月20日 30 71 32
数据集概述 该数据集包含用于系统评估大语言模型(LLMs)能力的测试套件及执行结果,核心内容为LLMs基于自然语言生成XMI格式有效UML模型的相关数据,支持研究模型建模任务表现及改进方向。 文件详解 文档类文件: README.md:Markdown格式,说明数据集目标、作者及文件结构...
-
Copilot_Responses_Based_2025年1月预设提示词回复完整数据
2025年12月8日 30 201 86
数据集概述 该数据集包含2025年1月16日至17日期间,由聊天机器人Copilot针对50个预设提示词生成的回复内容。提示词以橙色框标注,回复内容直接复制自聊天记录,整体以PDF格式存储。 文件详解 文件名称: Dataset_16 Jan_ 2025.pdf 文件格式: PDF (.pdf) 文件内容:...
-
敏捷电子采购系统中基于Groq_LLM的用户故事生成数据集
2025年12月8日 30 101 13
数据集概述 本数据集支持在敏捷电子采购系统中使用Groq LLM与手动方法生成用户故事的对比研究,包含配对用户故事、生成提示词、ROUGE评分评估及用户满意度调查结果,用于AI辅助需求工程等相关研究。 文件详解 文件名称: Raw Data User Story Automation.zip 文件格式: ZIP压缩包 内容说明:...
-
自然语言生成文章写作质量评估数据集
2025年11月5日 30 111 104
自然语言生成文章写作质量评估数据集_Natural_Language_Generation_Article_Writing_Quality_Assessment 数据来源:互联网公开数据 标签:自然语言生成, 文本质量评估, 写作质量, 语言模型, 生成文本, 文本分析, 机器学习, 语料库 数据概述:...
-
诗歌与更多诗意数据集-2023-watrgoat
2025年6月1日 30 82 0
诗歌与更多诗意数据集-2023-watrgoat 数据来源:互联网公开数据 标签:诗歌,文学,自然语言生成,NLG,文本生成,语言学,英语诗歌 数据概述:...
-
菜谱文本生成数据集RecipeTextGenerationDataset-rafaykhattak
2025年5月7日 30 43 2
菜谱文本生成数据集RecipeTextGenerationDataset-rafaykhattak 数据来源:互联网公开数据 标签:菜谱, 食谱, 自然语言生成, 文本摘要, 命名实体识别, 食材识别, 文本数据, 烹饪 数据概述:...
-
自然语言生成模型幻觉评估训练数据集NaturalLanguageGenerationModelHallucinationEvaluationTrainin...
2025年5月1日 30 47 21
自然语言生成模型幻觉评估训练数据集NaturalLanguageGenerationModelHallucinationEvaluationTrainingDataset-adarshsai 数据来源:互联网公开数据 标签:自然语言生成, 模型幻觉, 文本生成, 问答系统, 事实性评估, 数据集构建, 机器学习, 文本分析 数据概述:...
-
自然语言生成WebNLG训练数据集NaturalLanguageGenerationWebNLGTrainingDataset-rajaatreya
2025年4月29日 30 204 154
自然语言生成WebNLG训练数据集NaturalLanguageGenerationWebNLGTrainingDataset-rajaatreya 数据来源:互联网公开数据 标签:自然语言生成, 文本生成, 机器翻译, 数据集, 文本摘要, 知识图谱, 对话生成, 语义理解 数据概述:...
-
Open-Assistant多轮对话波斯语翻译数据集
2025年4月22日 30 45 20
Open-Assistant多轮对话波斯语翻译数据集 数据来源:互联网公开数据 数据集简介: 本数据集为 Open-Assistant...
-
端到端自然语言生成餐厅领域挑战数据集-2017-mexwell
2025年4月22日 30 157 12
端到端自然语言生成餐厅领域挑战数据集-2017-mexwell 数据来源:互联网公开数据 标签:自然语言生成,NLG,端到端,数据驱动,餐厅领域,挑战数据集,文本生成 数据概述:...



