-
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai
越南新闻摘要数据集VietnameseSummaryDataset-trinhnguyenthmai 数据来源:互联网公开数据 标签:越南语,文本摘要,数据集,自然语言处理,NLP,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自越南新闻网站的文章及其对应的摘要。主要特征如下:... -
新闻头条数据集NewsHeadlineDataset-satyamneelmani
新闻头条数据集NewsHeadlineDataset-satyamneelmani 数据来源:互联网公开数据 标签:新闻,头条,数据集,文本分析,自然语言处理,机器学习,信息检索,舆情分析 数据概述:该数据集包含来自各大新闻媒体的头条新闻数据,记录了新闻的标题,发布时间,来源媒体,新闻类别等信息。主要特征如下:... -
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15 数据来源:互联网公开数据 标签:问答平台,自然语言处理,数据集,文本分析,机器学习,语义分析,社交媒体,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题数据,记录了用户提出的各种问题及其相关信息。主要特征如下:... -
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac 数据来源:互联网公开数据 标签:学术研究,论文摘要,自然语言处理,文本分析,信息检索,机器学习,学术文献,文本挖掘 数据概述: 该数据集包含来自不同学术领域的论文摘要,记录了论文的研究主题,方法,结果和结论。主要特征如下:... -
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。... -
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,句子分析,数据集,文本挖掘,机器学习,语义分析,信息检索 数据概述: 该数据集包含关键词与句子之间的关系数据,记录了关键词在句子中的出现位置,语义关联等信息。主要特征如下:... -
道琼斯工业平均指数新闻数据集2010-2024-ahmadkhadra321
道琼斯工业平均指数新闻数据集2010-2024-ahmadkhadra321 数据来源:互联网公开数据 标签:道琼斯工业平均指数,新闻数据集,金融新闻,经济分析,数据挖掘,市场预测,机器学习,信息检索 数据概述:... -
学术研究论文数据集ResearchPaperDataset-harunshimanto
学术研究论文数据集ResearchPaperDataset-harunshimanto 数据来源:互联网公开数据 标签:学术研究,论文数据,数据集,文本分析,自然语言处理,机器学习,信息检索,教育研究 数据概述: 该数据集包含来自学术研究领域的论文数据,记录了学术期刊,会议和相关出版物上发表的研究论文的详细信息。主要特征如下:... -
COVID-19疫情论文搜索结果数据集COVID-19PandemicPaperSearchResultsDataset-jiteshpabla
COVID-19疫情论文搜索结果数据集COVID-19PandemicPaperSearchResultsDataset-jiteshpabla 数据来源:互联网公开数据 标签:COVID-19,疫情,论文,文献,搜索,自然语言处理,信息检索,生物医学 数据概述: 该数据集包含了从COVID-19 Open Research Dataset... -
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla 数据来源:互联网公开数据 标签:金融,问答系统,RAG,自然语言处理,数据集,文本分析,机器学习,信息检索 数据概述: 该数据集包含从金融领域文档中提取的,用于构建问答系统(RAG,Retrieval-Augmented... -
新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy
新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本挖掘,信息检索,新闻组,数据科学 数据概述: 该数据集包含来自20个不同新闻组的文本数据,记录了从1993年到1994年的新闻文章。主要特征如下:... -
谷歌问答数据集GoogleQuestionDataset-tankmitesh
谷歌问答数据集GoogleQuestionDataset-tankmitesh 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,信息检索,人工智能,搜索引擎,用户查询 数据概述: 该数据集包含来自谷歌搜索引擎的用户查询数据,记录了用户向谷歌搜索提问的具体内容和相关特征。主要特征如下:... -
问答历史数据集QNAHistoryDataset-donutkashvi
问答历史数据集QNAHistoryDataset-donutkashvi 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能,教育技术 数据概述: 该数据集包含来自问答平台的问答历史记录,记录了用户提问和系统回答的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
问答系统隐性评价数据集Answer-HydeDataset-kusnguyen
问答系统隐性评价数据集Answer-HydeDataset-kusnguyen 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,信息检索,深度学习,文本生成,评估指标 数据概述: 该数据集由Answer-Hyde项目提供,专注于问答系统的隐性评价和性能评估。主要特征如下: 时间跨度:数据记录的时间范围为最近几年,具体未明确。... -
问答对拆分训练数据集SplittedTrainQ-ADataset-thimkth
问答对拆分训练数据集SplittedTrainQ-ADataset-thimkth 数据来源:互联网公开数据 标签:问答对,数据集,自然语言处理,文本分析,机器学习,知识图谱,文本挖掘,信息检索 数据概述: 该数据集包含拆分后的问答对数据,主要用于训练和评估自然语言处理模型。主要特征如下: 时间跨度:数据记录时间不限。... -
Linux系统英文单词数据集LinuxWordsDataset-durrivedfunktor
Linux系统英文单词数据集LinuxWordsDataset-durrivedfunktor 数据来源:互联网公开数据 标签:计算机科学,数据集,文本分析,英文单词,操作系统,软件工程,自然语言处理,信息检索 数据概述: 该数据集包含来自 Linux 系统的英文单词列表,记录了 Linux 操作系统中所包含的常用英文单词。主要特征如下:... -
阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled
阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled 数据来源:互联网公开数据 标签:问答系统,自然语言处理,阿拉伯语,数据集,文本分析,信息检索,机器学习,语言学 数据概述: 该数据集收录了阿拉伯语维基百科中的问答对,旨在促进阿拉伯语问答系统的研究和开发。主要特征如下:... -
自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg
自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg 数据来源:互联网公开数据 标签:自然语言处理,词袋模型,数据集,文本分类,机器学习,文本分析,数据挖掘,信息检索 数据概述: 该数据集包含自然语言处理中词袋模型的提交数据,记录了文本分类,关键词提取等任务的样本和标签。主要特征如下:... -
新闻文本分类数据集NewsLabelSortedDataset-rwindia
新闻文本分类数据集NewsLabelSortedDataset-rwindia 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,数据集,自然语言处理,机器学习,信息检索,数据科学,分类算法 数据概述: 该数据集包含来自多个新闻平台的文本数据,记录了不同类别的新闻文章及其对应的标签。主要特征如下:... -
维基百科数据集DCWikiDataCSV-jungwoonseok
维基百科数据集DCWikiDataCSV-jungwoonseok 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,机器学习,信息检索,学术资源,知识图谱 数据概述:该数据集包含来自维基百科的数据,记录了大量维基百科页面的内容和属性。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...