找到21个数据集

分类: 公开数据 标签: 问答系统

过滤结果
  • 五尾多轮视觉推理数据集

    2025年12月20日 30 68 53

    数据集概述 该数据集围绕五尾多轮视觉推理(5T‑MVR)构建,包含评估五种提示条件(BASELINE、OBSERVE、ANALYZE、EVALUATE、INTERPRET)在五轮图像刺激对话中的脚本、样本数据、结果文件及说明文档,支持通过OpenAI API生成日志、分析对话轮次并生成可视化结果。 文件详解...
    packageimg
  • SQA3D_3D场景情境化问答数据集

    2025年12月19日 30 155 130

    数据集概述 该数据集围绕3D场景情境化问答任务构建,基于ScanNet的650个场景,包含6.8千个独特情境、20.4千条情境描述及33.4千个推理问题,覆盖空间关系、常识理解等能力,用于评估智能体的3D场景理解与推理性能。 文件详解 文件名称: answer_counter.json:JSON格式文件,可能用于统计或记录问答相关的计数信息。...
    packageimg
  • SciQA基准数据集及RDF转储数据

    2025年12月19日 30 190 180

    数据集概述 本数据集包含SciQA基准的问题与查询数据,分为人工构建(一百条)和自动生成(两千四百六十五条)两类问题。提供JSON格式的问题/查询文件及RDF NTriples格式的转储文件,支持导入RDF引擎进行查询分析。 文件详解 该数据集包含两个压缩文件,具体说明如下: - 文件名称: SciQA-...
    packageimg
  • 东京都立大学在线学习系统日语FAQ数据集

    2025年12月13日 30 96 10

    数据集概述 该数据集包含东京都立大学在线学习系统的FAQ数据及其分类,用于训练专用聊天机器人。数据基于2015年4月至2018年7月师生使用系统时的真实问答记录,提供日语原版及英文翻译版数据,支持学术研究。 文件详解 该数据集包含两类文件,具体说明如下: - FAQ数据文件(CSV格式): - Answer2Category.csv:答案分类对应关系...
    packageimg
  • 糖尿病黄斑水肿视觉问答数据集

    2025年12月11日 30 188 49

    数据集概述 该数据集是基于IDRiD和eOphta数据集构建的医学视觉问答(VQA)数据集,包含健康与病变眼底图像,针对每张图像生成预定义问题,部分区域相关问题附带位置掩码,可用于研究VQA模型的一致性。 文件详解 文件名称: dme_vqa.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 语义相关性句子对数据集2023

    2025年12月9日 30 135 103

    数据集概述 该数据集包含五千五百个英文句子对,每个句子对依据语义相关程度被赋予零到一的评分,零代表最不相关,一代表最相关。数据通过最佳最差标度法(Best-Worst Scaling)收集,旨在支持句子语义相关性、句子表示方法及相关应用的研究。 文件详解 核心数据文件: sem_text_rel_ranked.csv:...
    packageimg
  • Mistral_Small_3_1模型系统评估问答数据集

    2025年12月9日 30 167 140

    数据集概述 该数据集包含用于大型语言模型(LLM)知识系统评估的德语开放式和选择题问答数据,记录了Mistral Small 3.1模型的回答结果,支持LLM知识能力的评估分析。 文件详解 文件名称: C_1.0.pdf,文件格式: PDF,内容为德语问答相关的文档 文件名称: C_2.0.pdf,文件格式: PDF,内容为德语问答相关的文档...
    packageimg
  • 多源信息检索与问答的多智能体系统编排数据集

    2025年12月7日 30 169 91

    数据集概述 本数据集核心内容为一个基于大语言模型的多智能体系统框架文档,该框架用于多源信息检索与问答任务,整合非结构化文档与结构化数据库信息,通过专业智能体协作及自适应提示工程提升查询准确性,在合同管理领域验证了有效性。 文件详解 文件名称:13624ijnlc03.PDF 文件格式:PDF(.pdf)...
    packageimg
  • cBioPortal_Chroma_Based_2024_cBioPortal内容向量数据库完整数据

    2025年12月5日 30 144 117

    数据集概述 该数据集包含2024年7月收集的cBioPortal文档、Google Groups及研究文章的向量数据库,用于LangChain大语言模型聊天机器人应用,需配置环境变量和API密钥运行示例脚本。 文件详解 文件名称: cbioportal_chroma_zenodo.zip 文件格式: ZIP(.zip) 内容说明:...
    packageimg
  • 数据5个问答系统在QALD数据集上的学习问题数据集

    2025年12月5日 30 44 32

    数据集概述 该数据集提供5个问答系统(QA Systems)在QALD10、QALD9+DB和QALD9+WK三个数据集上的学习问题数据,以JSON格式存储。数据记录了各系统的性能表现,通过正负例区分系统回答正确(F1≥0.5)和错误(F1<0.5)的问题。 文件详解 文件名称: TF_Json.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 知识图谱问答系统评估数据集MQALD

    2025年12月5日 30 175 2

    数据集概述 该数据集用于评估知识图谱问答(QA over KG)系统的性能,聚焦于将复杂自然语言问题转化为合规数据查询语言的能力,尤其关注含聚合函数、查询形式等修饰符的复杂问题,为该领域研究提供公开评估资源。 文件详解 文件名称: MQALD_v4.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • SCAI_QReCC2021对话式问答共享任务结果数据集

    2025年12月4日 30 117 0

    数据集概述 本数据集为2021年SCAI-QReCC对话式问答共享任务的结果数据,基于原始QReCC数据集处理而成,包含任务数据集、答案合理性标注数据及相关压缩文件,支持对话式问答任务的研究与评估。 文件详解 任务数据集与标注文件: turns.zip:压缩文件,包含修正对话轮次编号的数据集拆分文件,如scai-qrecc21-training-...
    packageimg
  • PROSHNO_BINNASH孟加拉语多标签问题分类与翻译数据集

    2025年11月29日 30 177 171

    数据集概述 本数据集为孟加拉语PROSHNO BINNASH(问题分类)数据集,主要用于支持孟加拉语的多标签问题分类和问答任务。数据集包含两个Excel文件,分别存储原始孟加拉语问题及其英文翻译版本,为自然语言处理研究提供结构化的孟加拉语问题标注数据。 文件详解 原始孟加拉语问题文件 文件名称:PROSHNO BINNASH/Proshno_...
    packageimg
  • 印度人民院数据集2019_2024

    2025年11月29日 30 175 43

    数据集概述 该数据集基于印度第17届人民院(2019-2024)第一届会议数据构建,包含6200个文件,每个文件最多含6组对应问题与答案,覆盖多个相关部委,为研究印度议会问答内容提供结构化数据支持。 文件详解 文件名称: VindLok Dataset.xlsx 文件格式: Excel (.xlsx) 核心字段: Loksabha: 人民院届次...
    packageimg
  • 新冠病毒问答训练测试数据集

    2025年11月28日 30 116 8

    数据集概述 该数据集包含Naver Knowledge-iN用户提出的新冠病毒相关问题,分为训练集和测试集,以Excel格式存储,为新冠病毒相关问答任务的模型训练与测试提供数据支持。 文件详解 文件名称:COVID-19 train & test dataset/data.xlsx 文件格式:Excel (.xlsx) 文件内容:包含Naver...
    packageimg
  • 波斯语医药问答与专家回复专业数据集

    2025年11月28日 30 29 26

    数据集概述 该数据集包含一万二千三百九十九条按药品名称分类的波斯语评论,其中三千八百一十条(百分之三十八点一)附有专家回复及专家专业领域信息。数据集还涵盖药品名称、Martindale分类、专家类别与专业领域数据,以及波斯语内容的英文翻译版本。 文件详解 该数据集由数据文件和代码文件组成,具体说明如下: - 数据文件: - Dataset.xlsx:...
    packageimg
  • 肯尼亚卢希亚语卢马拉奇方言问答数据集

    2025年11月28日 30 208 177

    数据集概述 该数据集基于肯尼亚语言语料库Kencorpus项目中的137篇卢希亚语卢马拉奇方言文本,标注生成1000组问答对,是人工标注的低资源语言问答数据集,支持该方言的机器学习问答系统开发与测试。 文件详解 文件名称: KenLumachiQuAD.csv 文件格式: CSV 字段说明: Story_ID:...
    packageimg
  • 历史问答生成数据集

    2025年11月28日 30 62 10

    数据集概述 本数据集基于多视角对话历史生成问答对,核心内容是从Ubuntu对话语料库中提取多轮对话,通过对话ID合并为上下文后生成问题与答案,并标注答案在上下文中的起止位置,支持问答模型训练与评估。 文件详解 该数据集包含4个数据文件,具体说明如下: - 训练集文件: - train_data.csv:...
    packageimg
  • 规范性文档交互式问答数据集

    2025年11月28日 30 19 0

    数据集概述 该数据集包含基于十二份不同机构(大学与银行)规范性文档的问答对,由十五名标注者手动生成一千七百六十七个问题。文档平均十四页,每页约十二点八个问题,每段一点一个问题,段落覆盖率约百分之三十三。问答对含文档标题、路径、问题及原文答案,部分问题提供优化版本,支持交互式问答系统测试。 文件详解 该数据集包含文档文件与数据文件两类,具体说明如下: -...
    packageimg
  • 孟加拉国宪法问答数据集

    2025年11月27日 30 72 52

    数据集概述 该数据集专为自然语言处理(NLP)模型的开发与评估设计,聚焦问答任务。核心内容为基于孟加拉国宪法的问题及对应答案,旨在推动法律与政府文本相关NLP机器学习模型的研究进展。 文件详解 该数据集包含2个Excel文件,具体说明如下: - 文件名称: Songbidan datasets Bangla version.xlsx - 文件格式:...
    packageimg