-
TopiOCQA_独立文件_问答任务训练验证数据集
2026年1月31日 30 17 9
数据集概述 本数据集为TopiOCQA数据集的独立文件,包含训练和验证两个JSON文件,无目录结构,文件类型统一为JSON格式,可用于问答相关任务的模型训练与验证。 文件详解 训练文件 文件名称:topiocqa_train.json 文件格式:JSON 字段映射介绍:未提供具体字段信息,推测包含问答任务训练所需的输入输出数据。 验证文件...
-
ECQuAD_GoBots_Based_巴西电商问答阅读理解开发数据集
2026年1月26日 30 23 5
数据集概述 本数据集是针对巴西电商平台的阅读理解问答数据集(ECQuAD),由众包工作者基于商品描述标注问题,遵循SQuAD-v2格式,包含可回答与不可回答问题。数据集为开发版本,供公开使用,由GoBots提供,仅含一个文件。 文件详解 文件名称:ecquad_dev_v2.json 文件格式:JSON...
-
GeoQuestions1089_Based_YAGO2geo地理空间问答数据集_v1_1
2026年1月13日 30 15 6
数据集概述 本数据集是面向YAGO2geo知识图谱的众包地理空间问答数据集,包含1089组地理空间问题、对应答案及SPARQL/GeoSPARQL查询语句,可用于地理空间问答引擎的基准测试,提供v1.1版本,共2个JSON文件。 文件详解 文件名称:GeoQuestions1089.json 文件格式:JSON...
-
ChatGPT在编程教育中的影响问答数据集2023
2025年12月11日 30 78 57
数据集概述 本数据集收集了2023年7月24日至28日期间向ChatGPT 3.5版本提出的五个关于编程教育的问题及对应回答,核心围绕编程教育应用、优缺点、未来影响和伦理考量展开,反映ChatGPT对计算机科学编程及程序员培训领域的观点。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称:...
-
Mistral_Small_3_1模型系统评估问答数据集
2025年12月9日 30 160 97
数据集概述 该数据集包含用于大型语言模型(LLM)知识系统评估的德语开放式和选择题问答数据,记录了Mistral Small 3.1模型的回答结果,支持LLM知识能力的评估分析。 文件详解 文件名称: C_1.0.pdf,文件格式: PDF,内容为德语问答相关的文档 文件名称: C_2.0.pdf,文件格式: PDF,内容为德语问答相关的文档...
-
肯尼亚卢希亚语卢马拉奇方言问答数据集
2025年11月28日 30 27 8
数据集概述 该数据集基于肯尼亚语言语料库Kencorpus项目中的137篇卢希亚语卢马拉奇方言文本,标注生成1000组问答对,是人工标注的低资源语言问答数据集,支持该方言的机器学习问答系统开发与测试。 文件详解 文件名称: KenLumachiQuAD.csv 文件格式: CSV 字段说明: Story_ID:...
-
古兰经圣训注释问答语言建模数据集QuranHadithTafseerQAforLanguageModelling-omarrelsayeed
2025年5月28日 30 81 80
古兰经圣训注释问答语言建模数据集QuranHadithTafseerQAforLanguageModelling-omarrelsayeed 数据来源:互联网公开数据 标签:古兰经,圣训,注释,问答数据集,语言建模,自然语言处理,宗教研究,数据科学 数据概述:该数据集包含古兰经、圣训及其注释的问答数据,适用于语言建模、自然语言处理等任务。主要特征如下:...
-
法国高等教育MIP专业问答数据集FrenchHigherEducationMIPProgramQuestion-AnswerDataset-salma31nidar
2025年4月29日 30 154 6
法国高等教育MIP专业问答数据集FrenchHigherEducationMIPProgramQuestion-AnswerDataset-salma31nidar 数据来源:互联网公开数据 标签:MIP专业, 法国教育, 问答数据集, 教育研究, 自然语言处理, 知识检索, 文本分析, 学生学习 数据概述:...
-
多语言问答训练数据集-MLQA-XQUAD印地文MultilingualQuestionAnsweringTrainingDataset-MLQA-XQU...
2025年4月25日 30 96 22
多语言问答训练数据集-MLQA-XQUAD印地文MultilingualQuestionAnsweringTrainingDataset-MLQA-XQUADHindi-abhilashgahankari 数据来源:互联网公开数据 标签:多语言问答,数据集,机器学习,自然语言处理,文本分析,印地文,问答系统,语言技术 数据概述:...
-
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais
2025年4月25日 30 84 13
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:...
-
斯坦福问答数据集SQuAD-donutkashvi
2025年4月24日 30 55 37
斯坦福问答数据集SQuAD-donutkashvi 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器阅读理解,文本理解,深度学习,人工智能,NLP 数据概述: 该数据集包含了斯坦福大学开发的问答数据集,用于评估机器阅读理解能力。主要特征如下:...
-
大规模问答数据集助力智能问答系统开发
2025年4月22日 31 48 12
标题:大规模问答数据集助力智能问答系统开发 数据内容:本数据集包含丰富的问答数据,其中“problem”字段记录了1648种不同的问题,覆盖了广泛的知识领域;“answer”字段则提供了526种不同的答案,为每个问题提供了详细的解答。数据内容涵盖多个领域,可以用于训练和优化智能问答系统。 数据来源:互联网公开数据...
-
LC-QuAD2-0问答数据集-thedevastator
2025年4月21日 30 203 96
LC-QuAD2-0问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答系统,SPARQL查询,Wikidata,DBpedia,自然语言处理,机器学习,教育,科研 数据概述: LC-QuAD 2.0...
-
SPIKE-QA问答数据集
2025年4月15日 30 77 34
SPIKE-QA问答数据集 数据来源:互联网公开数据 标签:问答数据集,GPT4o-small,零样本学习,基础科学,复杂问题,日常聊天,Excel,CSV 数据概述: SPIKE-...
-
印度技术挑战赛问答数据集2023
2025年4月15日 30 70 19
印度技术挑战赛问答数据集2023 数据来源:互联网公开数据 标签:问答数据集,印度技术挑战赛,问题解决,自然语言处理,机器学习,教育应用 数据概述: 本数据集来源于2023年印度技术挑战赛(Inter IIT Tech Meet 11.0),由印度理工学院坎普尔(IIT...
-
斯里兰卡麻醉药品法问答数据集
2025年4月15日 30 172 58
斯里兰卡麻醉药品法问答数据集 数据来源:互联网公开数据 标签:斯里兰卡,麻醉药品法,问答数据集,法律文本分析,自然语言处理,法律信息抽取 数据概述:...
-
HotpotQA维基百科问答数据集
2024年11月10日 120 142 102
HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A...



