-
搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld
搜索引擎查询数据集20k-QueriesPreprocessedSegmentedData-ictworld 数据来源:互联网公开数据 标签:搜索引擎,查询分析,数据集,自然语言处理,文本挖掘,信息检索,用户行为,数据科学 数据概述: 该数据集包含来自搜索引擎的预处理和分词后的查询数据,记录了用户输入的搜索查询信息。主要特征如下:... -
文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte
文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte 数据来源:互联网公开数据 标签:文本挖掘,数据集,人工智能,自然语言处理,机器学习,文本分析,数据清洗,信息检索 数据概述:该数据集包含经过清理和预处理的文本数据,适用于文本挖掘和人工智能领域的研究和应用。主要特征如下:... -
法律文档检索与分类数据集ZaloAILegalRetrievalDataset-phandat12082002
法律文档检索与分类数据集ZaloAILegalRetrievalDataset-phandat12082002 数据来源:互联网公开数据 标签:法律文档,数据集,信息检索,自然语言处理,文本分类,法律研究,机器学习,人工智能 数据概述:... -
法律文书问答数据集LegalDocumentQuestionAnsweringDataset-lthnhtinostic
法律文书问答数据集LegalDocumentQuestionAnsweringDataset-lthnhtinostic 数据来源:互联网公开数据 标签:问答系统, 法律文本, 信息检索, 自然语言处理, 文本理解, 知识库, 司法, 越南语 数据概述: 该数据集包含来自越南法律文书的问答对,记录了用户提出的问题及其对应的法律条文上下文。主要特征如下:... -
问答系统与自然语言处理数据集DatasetfromQuACandSQuAD1with3000RowsMore-pedromoya
问答系统与自然语言处理数据集DatasetfromQuACandSQuAD1with3000RowsMore-pedromoya 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,深度学习,信息检索,人工智能 数据概述: 该数据集整合了QuAC和SQuAD... -
arXiv多分类数据集arXivMulticlassDataset-mahdmedsuccour
arXiv多分类数据集arXivMulticlassDataset-mahdmedsuccour 数据来源:互联网公开数据 标签:学术研究,机器学习,数据集,文本分类,自然语言处理,分类算法,学术论文,信息检索 数据概述: 该数据集来源于arXiv(预印本论文库),包含了大量学术论文的文本数据,旨在用于多分类任务。主要特征如下:... -
法律文书检索数据集-lthnhtinostic
法律文书检索数据集-lthnhtinostic 数据来源:互联网公开数据 标签:法律,文书检索,文本分析,信息检索,自然语言处理,数据集,机器学习,法律科技 数据概述: 该数据集包含来自法律领域的公开法律文书,旨在用于法律文书的检索和分析。主要特征如下: 时间跨度: 数据记录的时间范围为不限,具体取决于数据来源的开放程度。 地理范围:... -
虚假新闻检测数据集FakeNewsDetectionDataset-sreechrn
虚假新闻检测数据集FakeNewsDetectionDataset-sreechrn 数据来源:互联网公开数据 标签:虚假新闻,新闻检测,自然语言处理,机器学习,文本分类,深度学习,信息检索,文本分析 数据概述: 该数据集包含来自互联网的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:... -
新闻文章文本内容分析数据集NewsArticleTextContentAnalysis-illusionnnnnnnn
新闻文章文本内容分析数据集NewsArticleTextContentAnalysis-illusionnnnnnnn 数据来源:互联网公开数据 标签:新闻文章, 文本内容, 自然语言处理, 文本摘要, 情感分析, 信息检索, 机器学习, 数据集 数据概述:... -
维基百科百科全书数据集WikipediaEncyclopediaDataset-jayaprakashpondy
维基百科百科全书数据集WikipediaEncyclopediaDataset-jayaprakashpondy 数据来源:互联网公开数据 标签:百科全书,数据集,文本分析,知识图谱,自然语言处理,机器学习,信息检索,语义分析 数据概述: 该数据集包含来自维基百科的百科全书数据,记录了维基百科收录的各类知识条目及其详细信息。主要特征如下:... -
越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree
越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 语料库, 信息检索, 语言模型, 数据集 数据概述: 该数据集包含来自越南语问答系统的数据,记录了越南语问题及其对应的标识符。主要特征如下:... -
新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997
新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997 数据来源:互联网公开数据 标签:新闻语料库,文本分类,信息检索,数据集,自然语言处理,机器学习,文本分析,相关性判断 数据概述: 该数据集包含来自新闻语料库(NF Corpus)的训练数据,记录了新闻文章及其与特定查询词的相关性判断。主要特征如下:... -
越南语问答数据集VietnameseQuestionAnsweringDataset-tunphmnguynanh
越南语问答数据集VietnameseQuestionAnsweringDataset-tunphmnguynanh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 信息检索, 机器阅读理解, 语料库, 数据集 数据概述:... -
新闻推荐系统数据集NewsRecommendationDataset-mitul777
新闻推荐系统数据集NewsRecommendationDataset-mitul777 数据来源:互联网公开数据 标签:新闻推荐,数据集,推荐系统,机器学习,自然语言处理,信息检索,用户体验,数据挖掘 数据概述: 该数据集专注于新闻推荐领域,记录了用户与新闻内容的交互行为,适用于新闻推荐系统的研究与开发。主要特征如下:... -
法律问答上下文数据集LegalQuestionAnsweringContextDataset-ictworld
法律问答上下文数据集LegalQuestionAnsweringContextDataset-ictworld 数据来源:互联网公开数据 标签:法律问答, 信息检索, 文本理解, 上下文匹配, 问答系统, 自然语言处理, 语料库, 越南语 数据概述:... -
越南多文档数据集VietnameseMulti-DocumentDataset-nguyenvuthanhtung
越南多文档数据集VietnameseMulti-DocumentDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:越南语,数据集,多文档,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述:该数据集包含来自越南的多文档数据,记录了越南语文本的详细信息。主要特征如下:... -
数据2020年20-000条查询预处理数据集20kQueriesPreprocessedData2020-ictworld
2020年20-000条查询预处理数据集20kQueriesPreprocessedData2020-ictworld 数据来源:互联网公开数据 标签:查询数据,数据预处理,数据集,自然语言处理,搜索引擎,文本分析,机器学习,信息检索 数据概述:... -
新闻文章内容挖掘数据集NewsArticleContentMiningDataset-tousifmdaminfaisal
新闻文章内容挖掘数据集NewsArticleContentMiningDataset-tousifmdaminfaisal 数据来源:互联网公开数据 标签:新闻文章,内容挖掘,自然语言处理,文本分析,情感分析,主题建模,信息检索,机器学习 数据概述: 该数据集包含了来自各种新闻媒体的文章内容,旨在用于内容挖掘、文本分析和自然语言处理研究。主要特征如下:... -
维基百科训练数据集Wiki-TrainDataset-victoriasaz
维基百科训练数据集Wiki-TrainDataset-victoriasaz 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,维基百科,文本分类,语言模型,信息检索 数据概述: 该数据集包含来自维基百科的文本数据,主要用于训练自然语言处理模型。主要特征如下:... -
词向量与联系人评估数据集-dionisistotsila
词向量与联系人评估数据集-dionisistotsila 数据来源:互联网公开数据 标签:自然语言处理,联系人管理,数据集,词向量,文本分析,机器学习,关系提取,信息检索 数据概述: 该数据集包含用于评估词向量在联系人信息处理中的应用的数据,侧重于联系人之间的关系分析和信息提取。主要特征如下: 时间跨度:...