-
Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan
Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述: 该数据集源自Quora平台,记录了平台上用户提出的重复问题及其相关信息。主要特征如下:... -
问答系统Python微调数据集Question-AnswerPythonLoraFine-tuningDataset-ashish32700
问答系统Python微调数据集Question-AnswerPythonLoraFine-tuningDataset-ashish32700 数据来源:互联网公开数据 标签:问答系统,Python,微调,数据集,自然语言处理,机器学习,深度学习,人工智能 数据概述:... -
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj 数据来源:互联网公开数据 标签:文档摘要,摘要生成,自然语言处理,机器学习,文本分析,问答系统,数据集,信息检索 数据概述:该数据集包含来自多个来源的文档及其对应的摘要,适用于基于查询的文档摘要生成任务。主要特征如下:... -
Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc
Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc 数据来源: 互联网公开数据 标签: 问答系统,自然语言处理,数据集,机器学习,文本分析,语义理解,深度学习,人工智能 数据概述: 该数据集源自斯坦福大学的 SQuAD 2020 项目,专注于问答系统的训练和评估。主要特征如下:... -
问答数据集涵盖广泛主题的高质量问答内容
标题:问答数据集涵盖广泛主题的高质量问答内容 数据内容:该数据集包含问答对的结构化信息,主要包括以下字段: - question:问题描述,包含3510种不同值 - answer:对应问题的答案,包含3512种不同值 - (未命名字段):3725种不同值,可能是问题类别或其他元数据 数据来源:互联网公开数据... -
策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020
策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020 数据来源:互联网公开数据 标签:策略问答,数据集,自然语言处理,机器学习,语言模型,训练数据,问答系统,人工智能 数据概述:该数据集包含来自StrategyQA项目的训练数据,用于策略问答系统的训练。主要特征如下:... -
问题集数据集Question-SetDataset-tanujsaxena
问题集数据集Question-SetDataset-tanujsaxena 数据来源:互联网公开数据 标签:问题集,数据集,自然语言处理,文本分析,机器学习,教育研究,问答系统,人工智能 数据概述: 该数据集包含来自公开来源的问题集合,记录了各类问题的文本内容和相关信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。... -
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:... -
自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus
自然语言处理问答任务数据集ChAIiTrainFixedDataset-zacchaeus 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,文本分析,深度学习,人工智能,信息检索 数据概述: 该数据集来源于ChAIi问答任务竞赛,专注于自然语言处理领域的问答系统研究。主要特征如下:... -
谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530
谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,人工智能,语义理解,信息检索 数据概述: 该数据集是谷歌问答数据集的扩展版本,包含来自谷歌问答社区的问答数据,记录了用户提交的问题及其对应的回答内容。主要特征如下:... -
Quora问题重复检测预处理数据集QuoraQuestionDuplicationPreprocessingDataset-khaiurl
Quora问题重复检测预处理数据集QuoraQuestionDuplicationPreprocessingDataset-khaiurl 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,分类任务,问答系统,重复检测,文本预处理 数据概述:... -
泰米尔语开放域问答数据集TamilOdqaDataset-aswin037
泰米尔语开放域问答数据集TamilOdqaDataset-aswin037 数据来源:互联网公开数据 标签:泰米尔语,开放域问答,数据集,自然语言处理,机器学习,文本理解,问答系统,多语言 数据概述: 该数据集包含来自泰米尔语的开放域问答数据,记录了泰米尔语文本及其对应的问答对。主要特征如下:... -
数据80K孟加拉语问答数据集80KBanglaQADataset-sihabhossan
80K孟加拉语问答数据集80KBanglaQADataset-sihabhossan 数据来源:互联网公开数据 标签:问答系统,自然语言处理,孟加拉语,数据集,机器学习,语言技术,教育,学术研究 数据概述: 该数据集包含80,000条孟加拉语问答对,适用于自然语言处理,机器学习及问答系统的研究与开发。主要特征如下:... -
数学问答数据集QnA-Maths-1024Dataset-donutkashvi
数学问答数据集QnA-Maths-1024Dataset-donutkashvi 数据来源:互联网公开数据 标签:数学,问答系统,数据集,教育技术,自然语言处理,人工智能,智能辅导,学习辅助 数据概述: 该数据集包含来自数学领域的问答数据,记录了用户提出的数学问题和对应的解答。主要特征如下: 时间跨度:数据记录的时间范围为2010年至2022年。... -
问答翻译数据集-日语到英语QA-ARGOS-JA-TO-ENDataset-gowatanabe
问答翻译数据集-日语到英语QA-ARGOS-JA-TO-ENDataset-gowatanabe 数据来源:互联网公开数据 标签:机器翻译,问答系统,日语,英语,数据集,自然语言处理,跨语言,人工智能 数据概述: 该数据集包含来自ARGOS项目的日语到英语问答翻译数据,旨在促进机器翻译和跨语言问答系统的研究。主要特征如下:... -
孟加拉语问答数据集BengaliQuestionAnsweringDataset-prantikbanerjee
孟加拉语问答数据集BengaliQuestionAnsweringDataset-prantikbanerjee 数据来源:互联网公开数据 标签:自然语言处理,问答系统,孟加拉语,数据集,文本分析,语言模型,机器阅读理解,人工智能 数据概述: 该数据集包含孟加拉语的问答对,旨在促进孟加拉语自然语言处理领域的研究和发展。主要特征如下:... -
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla 数据来源:互联网公开数据 标签:金融,问答系统,RAG,自然语言处理,数据集,文本分析,机器学习,信息检索 数据概述: 该数据集包含从金融领域文档中提取的,用于构建问答系统(RAG,Retrieval-Augmented... -
谷歌问答数据集GoogleQuestionDataset-tankmitesh
谷歌问答数据集GoogleQuestionDataset-tankmitesh 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,信息检索,人工智能,搜索引擎,用户查询 数据概述: 该数据集包含来自谷歌搜索引擎的用户查询数据,记录了用户向谷歌搜索提问的具体内容和相关特征。主要特征如下:... -
问答历史数据集QNAHistoryDataset-donutkashvi
问答历史数据集QNAHistoryDataset-donutkashvi 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能,教育技术 数据概述: 该数据集包含来自问答平台的问答历史记录,记录了用户提问和系统回答的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
问答系统隐性评价数据集Answer-HydeDataset-kusnguyen
问答系统隐性评价数据集Answer-HydeDataset-kusnguyen 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,信息检索,深度学习,文本生成,评估指标 数据概述: 该数据集由Answer-Hyde项目提供,专注于问答系统的隐性评价和性能评估。主要特征如下: 时间跨度:数据记录的时间范围为最近几年,具体未明确。...