-
图像多模态问答数据集
2026年3月11日 30 16 4
图像多模态问答数据集_Image_Multimodal_Question_Answering_Dataset 数据来源:互联网公开数据 标签:多模态, 图像理解, 问答系统, 自然语言处理, 图像分类, 语义理解, 数据标注, 机器学习 数据概述: 该数据集包含来自多个来源的图像及其相关问题和答案,记录了针对不同图像内容的问答对。主要特征如下:...
-
柬埔寨宪法问答数据集
2026年3月11日 30 136 18
柬埔寨宪法问答数据集_Cambodian_Constitution_Question_Answering_Dataset 数据来源:互联网公开数据 标签:问答系统, 宪法, 柬埔寨, 自然语言处理, 文本生成, 法律, 知识检索, 机器学习 数据概述: 该数据集包含柬埔寨宪法相关的问答对,旨在为构建柬埔寨宪法领域的问答系统提供支持。主要特征如下:...
-
自然语言处理强化学习问答数据集
2026年3月6日 30 136 109
自然语言处理强化学习问答数据集_Natural_Language_Processing_Reinforcement_Learning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:自然语言处理, 强化学习, 问答系统, 文本生成, 对抗训练, 语言模型, 数据集构建, 模型训练 数据概述:...
-
阅读理解多项选择题数据集
2026年3月3日 30 13 2
阅读理解多项选择题数据集_Reading_Comprehension_Multiple_Choice_Questions_Dataset 数据来源:互联网公开数据 标签:阅读理解, 文本理解, 多项选择, 机器阅读, 自然语言处理, 问答系统, 文本分类, 语料库 数据概述:...
-
法律问答语料库数据集
2026年3月3日 30 65 6
法律问答语料库数据集_Legal_Question_Answering_Corpus 数据来源:互联网公开数据 标签:法律问答, 自然语言处理, 文本理解, 问答系统, 语料库, 文本检索, 机器阅读, 越南语 数据概述: 该数据集包含来自互联网的法律问答语料,记录了用户提出的问题、相关的法律文本上下文,以及问题标识符。主要特征如下:...
-
编程问答标题与文章数据集
2026年2月17日 30 197 90
编程问答标题与文章数据集_Programming_Q_A_Title_and_Article_Dataset 数据来源:互联网公开数据 标签:编程问答, 自然语言处理, 文本分析, 标题生成, 内容摘要, 问答系统, 机器学习, 代码示例 数据概述: 该数据集包含来自Stack...
-
LAYA_问答系统训练验证数据集
2026年2月12日 30 186 33
数据集概述 本数据集为LAYA问答系统相关数据集,包含训练和验证两类数据文件,文件总数为3个,涵盖JSONL和XLSX两种格式,主要用于问答系统的训练与验证场景,无目录结构,未提供文件内容预览及说明文档。 文件详解 文件1 文件名称:validation.jsonl 文件格式:JSONL...
-
NicheHazardQA_Based_问答系统数据集
2026年2月7日 30 88 17
数据集概述 本数据集为NicheHazardQA,包含一个JSON格式文件,未划分训练/测试集、数据/标签集及原始/处理数据集,无说明文档或内容预览,主要用于问答相关任务。 文件详解 数据文件 文件名称:NICHEHAZARDQA.json 文件格式:JSON 字段映射介绍:无可用内容预览,具体字段信息未提供 适用场景 问答系统开发:...
-
IAC_PAC_Q_A_PAIRS问答对数据
2026年2月1日 30 113 72
数据集概述 本数据集包含IAC_PAC相关的问答对内容,以单一文件形式呈现,未进行训练/测试、数据/标签或原始/处理数据的划分,可用于问答系统相关的研究与应用。 文件详解 文件名称:IAC_PAC_Q&A_PAIRS.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段预览,推测包含问答对相关的核心字段(如问题、答案等)。 适用场景...
-
TopiOCQA_Based_问答处理数据集
2026年2月1日 30 14 4
数据集概述 本数据集为TopiOCQA项目的处理数据集,包含18个文件,涉及训练集和验证集数据,涵盖黄金段落信息、检索器数据等内容,支持问答系统相关研究与实验,文件格式以JSON和CSV为主。 文件详解 黄金段落信息文件 目录路径:data/gold_passages_info/...
-
ACL25_Based_多轮系统对话数据_压缩包
2026年2月1日 30 183 75
数据集概述 本数据集包含ACL25相关的多轮系统对话内容,以压缩包形式提供,未划分训练/测试集、数据/标签集或原始/处理数据,无额外说明文档或内容预览,整体结构简洁,仅含一个压缩文件。 文件详解 压缩文件 文件名称:acl25-multiple-system-turns-dialogs.zip 文件格式:ZIP...
-
PANDAX_Based_工业系统问答解释数据集
2026年2月1日 30 38 8
数据集概述 本数据集为PANDAX(基于专利的工业问答解释数据集),是首个开源工业QAE数据集。数据源自PDF格式的专利文件,聚焦冷却系统、绿色技术(如可再生能源、碳捕获与存储)等工业系统领域,包含一千八百六十个QAE三元组,覆盖系统信息的部分onomy、功能、参数三类问题主题。 文件详解 PDF_patens.zip 文件格式:ZIP...
-
TopiOCQA_独立文件_问答任务训练验证数据集
2026年1月31日 30 124 62
数据集概述 本数据集为TopiOCQA数据集的独立文件,包含训练和验证两个JSON文件,无目录结构,文件类型统一为JSON格式,可用于问答相关任务的模型训练与验证。 文件详解 训练文件 文件名称:topiocqa_train.json 文件格式:JSON 字段映射介绍:未提供具体字段信息,推测包含问答任务训练所需的输入输出数据。 验证文件...
-
PathwayQA_Based医学疾病与反应问答数据集
2026年1月30日 30 120 10
数据集概述 本数据集为PathwayQA医学问答数据集,包含6个文件,涵盖医学疾病与反应相关的问答内容,涉及零样本、单样本、两样本问答及反应、通路的JSON数据。主要文件类型为CSV和JSON,无目录结构,未划分训练测试或数据标签集,可用于生物医学领域的问答任务研究。 文件详解 CSV文件(共4个)...
-
ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据
2026年1月30日 30 168 38
数据集概述 本数据集为斯洛文尼亚气候问答基准(ClimaQA_SLO),用于检验大语言模型在斯洛文尼亚环境相关领域(如气候变化、能源、林业)的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容,支持评估模型的气候领域专业知识准确性。 文件详解 文件名称:ClimaQA_SLO.xlsx 文件格式:XLSX...
-
LLMs_Heroes_Based_英雄主题问答文档数据
2026年1月30日 30 21 4
数据集概述 本数据集围绕“LLMs Heroes”主题展开问答内容,包含一份问答文档,可用于了解该主题下的相关问答信息,为相关研究或应用提供基础数据支持。 文件详解 文件名称:Questions and Answers_LLMs_Heroes.docx 文件格式:DOCX 字段映射介绍:文档类文件,具体字段信息未提供,推测包含与“LLMs...
-
TACO_Source_Twitter对话论点开源发布数据
2026年1月30日 30 199 119
数据集概述 本数据集为TACO(Twitter Arguments from COnversations)的开源发布数据,包含Twitter对话中的论点内容,以压缩包形式提供,无训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:TomatenMarc/TACO-Public-Data.zip 文件格式:.zip...
-
PhAQ_Based_直觉物理问答多模态神经网络训练数据集
2026年1月29日 30 126 17
数据集概述 本数据集为论文《PhAQ: Intuitive Physics Question Answering for Multi-Modal Neural Network training》配套数据,包含两种划分的压缩文件,用于多模态神经网络训练相关的直觉物理问答任务。 文件详解 500-split.zip 文件格式:ZIP...
-
BioASQ_Based_生物医学专家真实需求问答基准数据集
2026年1月29日 30 196 154
数据集概述 本数据集为BioASQ生物医学问答基准数据集,包含英文问题、标准参考答案及相关材料,反映生物医学专家真实信息需求,兼具挑战性与实用性。数据集融合结构化与非结构化数据,除精确答案外还包含理想答案(摘要形式),适用于问答系统、多文档摘要、信息检索等多任务研究,且随BioASQ挑战赛持续扩展。 文件详解 README文件 文件名称:README...



