数据集 - 海数据

图像多模态问答数据集

2026年3月11日 30 115 9

图像多模态问答数据集_Image_Multimodal_Question_Answering_Dataset 数据来源：互联网公开数据标签：多模态, 图像理解, 问答系统, 自然语言处理, 图像分类, 语义理解, 数据标注, 机器学习数据概述：该数据集包含来自多个来源的图像及其相关问题和答案，记录了针对不同图像内容的问答对。主要特征如下：...

ZIP

柬埔寨宪法问答数据集

2026年3月11日 30 68 25

柬埔寨宪法问答数据集_Cambodian_Constitution_Question_Answering_Dataset 数据来源：互联网公开数据标签：问答系统, 宪法, 柬埔寨, 自然语言处理, 文本生成, 法律, 知识检索, 机器学习数据概述：该数据集包含柬埔寨宪法相关的问答对，旨在为构建柬埔寨宪法领域的问答系统提供支持。主要特征如下：...

ZIP

自然语言处理强化学习问答数据集

2026年3月6日 30 133 104

自然语言处理强化学习问答数据集_Natural_Language_Processing_Reinforcement_Learning_Question_Answering_Dataset 数据来源：互联网公开数据标签：自然语言处理, 强化学习, 问答系统, 文本生成, 对抗训练, 语言模型, 数据集构建, 模型训练数据概述：...

ZIP

军事新闻问答数据集

2026年3月5日 30 145 143

军事新闻问答数据集_Military_News_Question_Answering_Dataset 数据来源：互联网公开数据标签：问答系统, 军事新闻, 自然语言处理, 信息检索, 文本理解, 多文档阅读, 知识抽取, 语义分析数据概述：该数据集包含来自新闻报道和相关资料的问答对，旨在用于训练和评估问答系统在军事新闻领域的表现。主要特征如下：...

ZIP

阅读理解多项选择题数据集

2026年3月3日 30 22 21

阅读理解多项选择题数据集_Reading_Comprehension_Multiple_Choice_Questions_Dataset 数据来源：互联网公开数据标签：阅读理解, 文本理解, 多项选择, 机器阅读, 自然语言处理, 问答系统, 文本分类, 语料库数据概述：...

ZIP

法律问答语料库数据集

2026年3月3日 30 102 81

法律问答语料库数据集_Legal_Question_Answering_Corpus 数据来源：互联网公开数据标签：法律问答, 自然语言处理, 文本理解, 问答系统, 语料库, 文本检索, 机器阅读, 越南语数据概述：该数据集包含来自互联网的法律问答语料，记录了用户提出的问题、相关的法律文本上下文，以及问题标识符。主要特征如下：...

ZIP

编程问答标题与文章数据集

2026年2月17日 30 107 65

编程问答标题与文章数据集_Programming_Q_A_Title_and_Article_Dataset 数据来源：互联网公开数据标签：编程问答, 自然语言处理, 文本分析, 标题生成, 内容摘要, 问答系统, 机器学习, 代码示例数据概述：该数据集包含来自Stack...

ZIP

LAYA_问答系统训练验证数据集

2026年2月12日 30 134 101

数据集概述本数据集为LAYA问答系统相关数据集，包含训练和验证两类数据文件，文件总数为3个，涵盖JSONL和XLSX两种格式，主要用于问答系统的训练与验证场景，无目录结构，未提供文件内容预览及说明文档。文件详解文件1 文件名称：validation.jsonl 文件格式：JSONL...

ZIP

NicheHazardQA_Based_问答系统数据集

2026年2月7日 30 28 5

数据集概述本数据集为NicheHazardQA，包含一个JSON格式文件，未划分训练/测试集、数据/标签集及原始/处理数据集，无说明文档或内容预览，主要用于问答相关任务。文件详解数据文件文件名称：NICHEHAZARDQA.json 文件格式：JSON 字段映射介绍：无可用内容预览，具体字段信息未提供适用场景问答系统开发:...

ZIP

IAC_PAC_Q_A_PAIRS问答对数据

2026年2月1日 30 165 91

数据集概述本数据集包含IAC_PAC相关的问答对内容，以单一文件形式呈现，未进行训练/测试、数据/标签或原始/处理数据的划分，可用于问答系统相关的研究与应用。文件详解文件名称：IAC_PAC_Q&A_PAIRS.xlsx 文件格式：XLSX 字段映射介绍：未提供具体字段预览，推测包含问答对相关的核心字段（如问题、答案等）。适用场景...

ZIP

TopiOCQA_Based_问答处理数据集

2026年2月1日 30 174 44

数据集概述本数据集为TopiOCQA项目的处理数据集，包含18个文件，涉及训练集和验证集数据，涵盖黄金段落信息、检索器数据等内容，支持问答系统相关研究与实验，文件格式以JSON和CSV为主。文件详解黄金段落信息文件目录路径：data/gold_passages_info/...

ZIP

ACL25_Based_多轮系统对话数据_压缩包

2026年2月1日 30 12 11

数据集概述本数据集包含ACL25相关的多轮系统对话内容，以压缩包形式提供，未划分训练/测试集、数据/标签集或原始/处理数据，无额外说明文档或内容预览，整体结构简洁，仅含一个压缩文件。文件详解压缩文件文件名称：acl25-multiple-system-turns-dialogs.zip 文件格式：ZIP...

ZIP

PANDAX_Based_工业系统问答解释数据集

2026年2月1日 30 51 45

数据集概述本数据集为PANDAX（基于专利的工业问答解释数据集），是首个开源工业QAE数据集。数据源自PDF格式的专利文件，聚焦冷却系统、绿色技术（如可再生能源、碳捕获与存储）等工业系统领域，包含一千八百六十个QAE三元组，覆盖系统信息的部分onomy、功能、参数三类问题主题。文件详解 PDF_patens.zip 文件格式：ZIP...

ZIP

TopiOCQA_独立文件_问答任务训练验证数据集

2026年1月31日 30 115 0

数据集概述本数据集为TopiOCQA数据集的独立文件，包含训练和验证两个JSON文件，无目录结构，文件类型统一为JSON格式，可用于问答相关任务的模型训练与验证。文件详解训练文件文件名称：topiocqa_train.json 文件格式：JSON 字段映射介绍：未提供具体字段信息，推测包含问答任务训练所需的输入输出数据。验证文件...

ZIP

PathwayQA_Based医学疾病与反应问答数据集

2026年1月30日 30 49 46

数据集概述本数据集为PathwayQA医学问答数据集，包含6个文件，涵盖医学疾病与反应相关的问答内容，涉及零样本、单样本、两样本问答及反应、通路的JSON数据。主要文件类型为CSV和JSON，无目录结构，未划分训练测试或数据标签集，可用于生物医学领域的问答任务研究。文件详解 CSV文件（共4个）...

ZIP

ClimaQA_SLO_斯洛文尼亚气候领域问答基准数据

2026年1月30日 30 136 97

数据集概述本数据集为斯洛文尼亚气候问答基准（ClimaQA_SLO），用于检验大语言模型在斯洛文尼亚环境相关领域（如气候变化、能源、林业）的事实核查能力。数据集包含斯洛文尼亚语的气候知识问答内容，支持评估模型的气候领域专业知识准确性。文件详解文件名称：ClimaQA_SLO.xlsx 文件格式：XLSX...

ZIP

LLMs_Heroes_Based_英雄主题问答文档数据

2026年1月30日 30 96 1

数据集概述本数据集围绕“LLMs Heroes”主题展开问答内容，包含一份问答文档，可用于了解该主题下的相关问答信息，为相关研究或应用提供基础数据支持。文件详解文件名称：Questions and Answers_LLMs_Heroes.docx 文件格式：DOCX 字段映射介绍：文档类文件，具体字段信息未提供，推测包含与“LLMs...

ZIP

TACO_Source_Twitter对话论点开源发布数据

2026年1月30日 30 21 17

数据集概述本数据集为TACO（Twitter Arguments from COnversations）的开源发布数据，包含Twitter对话中的论点内容，以压缩包形式提供，无训练/测试、数据/标签或原始/处理数据的拆分。文件详解文件名称：TomatenMarc/TACO-Public-Data.zip 文件格式：.zip...

ZIP

PhAQ_Based_直觉物理问答多模态神经网络训练数据集

2026年1月29日 30 56 37

数据集概述本数据集为论文《PhAQ: Intuitive Physics Question Answering for Multi-Modal Neural Network training》配套数据，包含两种划分的压缩文件，用于多模态神经网络训练相关的直觉物理问答任务。文件详解 500-split.zip 文件格式：ZIP...

ZIP

BioASQ_Based_生物医学专家真实需求问答基准数据集

2026年1月29日 30 177 55

数据集概述本数据集为BioASQ生物医学问答基准数据集，包含英文问题、标准参考答案及相关材料，反映生物医学专家真实信息需求，兼具挑战性与实用性。数据集融合结构化与非结构化数据，除精确答案外还包含理想答案（摘要形式），适用于问答系统、多文档摘要、信息检索等多任务研究，且随BioASQ挑战赛持续扩展。文件详解 README文件文件名称：README...

ZIP

找到620个数据集

注册成功！