-
印度农民咨询电话问答数据集-daskoushik
印度农民咨询电话问答数据集-daskoushik 数据来源:互联网公开数据 标签:农业,农民,问答系统,自然语言处理,Kisan Call Centre,数据清洗,QA,印度 数据概述: 本数据集包含印度农民通过Kisan Call... -
LC-QuAD2-0问答数据集-thedevastator
LC-QuAD2-0问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答系统,SPARQL查询,Wikidata,DBpedia,自然语言处理,机器学习,教育,科研 数据概述: LC-QuAD 2.0... -
问答系统训练与测试数据集-sourabhsingh03993493
问答系统训练与测试数据集-sourabhsingh03993493 数据来源:互联网公开数据 标签:问答系统,机器学习,训练数据,测试数据,自然语言处理,MCQ 数据概述: 本数据集包含用于训练和测试问答系统的上下文、问题及其多选题(MCQ)类型的答案。数据集分为两部分:训练集(train dataset)和测试集(test... -
教学用NLP问答任务用标准训练语料数据集
教学用NLP问答任务用标准训练语料数据集 数据来源:互联网公开数据 数据概述: 该数据集原始版本由第三方作者发布,最初以 JSON 格式提供,需通过自定义数据加载器解析。本数据集由当前整理者转换为 可直接使用的 CSV 格式,以方便在监督学习任务中使用。原始数据作者信息可通过提供的链接查阅。 数据内容:... -
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi
智能问答聊天机器人用户交互与知识检索数据集-sadmansakibmahi 数据来源:互联网公开数据 标签:聊天机器人,自然语言处理,问答系统,知识库,信息检索,文本处理,用户交互,Wikipedia,数据分析 数据概述:... -
阿拉伯语乐器问答数据集-2023-lara311
阿拉伯语乐器问答数据集-2023-lara311 数据来源:互联网公开数据 标签:阿拉伯语,乐器,自然语言处理,NLP,虚拟助手,问答系统,教育,文化 数据概述:... -
问题回答问答数据集
问题回答问答数据集 数据来源:互联网公开数据 标签:问题回答,自然语言处理,问答系统,文本理解,信息抽取,文本定位,模型训练 数据概述: 本数据集包含多个问题回答任务相关的文本数据,旨在为自然语言处理和问答系统的研究提供支持。数据集中的每条记录包括以下字段: - Story:一段完整的文本内容,通常为叙述性或说明性段落。 -... -
法律文档检索数据集
法律文档检索数据集 数据来源:互联网公开数据 标签:法律文档,文本检索,问答系统,自然语言处理,信息抽取,司法应用,机器学习 数据概述: 本数据集旨在支持法律文档检索和问答系统的开发,包含三个主要文件:corpus.csv、train.csv 和 public_test.csv。 1. corpus.csv:存储法律文本及其唯一标识符,字段包括: -... -
-
HiDoctor波斯语健康美容博客数据集
HiDoctor波斯语健康美容博客数据集 数据来源:互联网公开数据 标签:健康,美容,波斯语,NLP任务,博客文章,多标签分类,文本摘要,问答系统,实体识别 数据概述: 本数据集包含40,000篇来自Hi... -
-
Quora问答平台问题真伪分类训练数据集-2018
Quora问答平台问题真伪分类训练数据集-2018 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问答系统,Quora,机器学习,训练数据,问题真伪,情感分析 数据概述:... -
自然问答数据集
自然问答数据集 数据来源:互联网公开数据 标签:自然问答,问答系统,自然语言处理,机器学习,数据预处理,问答生成,信息检索 数据概述: 本数据集由Google AI... -
MetaMathQA数学问题问答数据集Mistral-7B模型性能评估
MetaMathQA数学问题问答数据集Mistral-7B模型性能评估 数据来源:互联网公开数据 标签:数学,问答系统,自然语言处理,Mistral-7B,模型评估,机器学习,数据集,NLP 数据概述: 本数据集包含了由Mistral-7B问答系统生成的数学问题及其对应的回答。数据主要用于评估和提升MetaMathQA(MetaMath... -
Reddit问答社区百万提问数据分析数据集-AskReddit-时间序列-问答内容-不限时间
Reddit问答社区百万提问数据分析数据集-AskReddit-时间序列-问答内容-不限时间 数据来源:互联网公开数据 标签:Reddit,问答,提问,社交媒体,文本分析,自然语言处理,问答系统,问答社区,情感分析 数据概述:... -
大型语言模型训练合成数据-Synthia-v1-3数据集
大型语言模型训练合成数据-Synthia-v1-3数据集 数据来源:互联网公开数据 标签:大型语言模型,合成数据,训练数据,自然语言处理,文本生成,机器翻译,问答系统,对话生成 数据概述: 本数据集是专为大型语言模型(LLM)开发和改进而设计的合成训练数据集,主要用于研究和优化migel... -
SQuAD2-0问答系统训练数据集
SQuAD2-0问答系统训练数据集 数据来源:互联网公开数据 标签:问答系统,开放域,自然语言处理,机器学习,训练数据 数据概述: 本数据集是SQuAD 2.0训练数据集的CSV格式版本,适用于构建复杂的开放域问答系统。数据集包含问题、答案及其对应的文章段落,有助于训练模型理解上下文并生成准确的回答。 数据用途概述:... -
自然语言问答数据集QDMR分解结构分析数据集
自然语言问答数据集QDMR分解结构分析数据集 数据来源:互联网公开数据 标签:自然语言处理,问答系统,语义分解,QDMR,数据集,文本分析,机器学习,计算机科学 数据概述:... -
语言模型对比数据集
语言模型对比数据集 数据来源:互联网公开数据 标签:语言模型,对比分析,问答系统,Govinfo,正确答案,模型性能 数据概述: 本数据集包含从Govinfo网站收集的90个问题及其正确答案,并附录了五个不同语言模型对这些问题的回答。数据集涵盖了问题陈述、正确答案以及DeepSeek R1 14b qwen distill、Llama3.1... -
非监督学习自然语言处理数据集
非监督学习自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,非监督学习,问答系统,TF-IDF,文档检索 数据概述: 本数据集用于非监督学习中的问答系统训练。数据集中的每一行代表一个文档,适用于通过向量模型和TF-IDF方法检索用户查询的答案。该数据集包含大量的文本信息,为构建有效的问答系统提供了丰富的训练素材。 数据用途概述:...