-
大学建议与分类数据集UniversitySuggestionsandCategorizationDataset-pteacher
大学建议与分类数据集UniversitySuggestionsandCategorizationDataset-pteacher 数据来源:互联网公开数据 标签:教育,大学,建议,分类,数据集,机器学习,文本分析,信息检索 数据概述: 该数据集包含来自公开渠道的大学建议与分类数据,记录了针对不同大学的建议和分类信息。主要特征如下:... -
新闻文本分类测试数据集AG-sNewsTestDataset-datasontran
新闻文本分类测试数据集AG-sNewsTestDataset-datasontran 数据来源:互联网公开数据 标签:文本分类,新闻,数据集,自然语言处理,机器学习,情感分析,信息检索,深度学习 数据概述: 该数据集是AG's News数据集的测试子集,包含了来自4个不同新闻类别的新闻文章文本。主要特征如下:... -
伊朗波斯语文本数据集PersianDatasetIR-amirali10281
伊朗波斯语文本数据集PersianDatasetIR-amirali10281 数据来源:互联网公开数据 标签:波斯语,文本分析,自然语言处理,数据集,信息检索,情感分析,语言模型,机器学习 数据概述: 该数据集包含来自伊朗的波斯语文本数据,涵盖了多种来源和主题。主要特征如下:... -
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,相似度计算,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自网络评论的余弦相似度计算结果,记录了不同评论之间的相似度分数。主要特征如下:... -
局部敏感哈希LSH文档数据集-massivedatamining
局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。... -
加州律师黄页数据集CaliforniaLawyersYellowPagesDataset-kanchana1990
加州律师黄页数据集CaliforniaLawyersYellowPagesDataset-kanchana1990 数据来源:互联网公开数据 标签:法律行业,律师数据,黄页信息,数据集,信息检索,职业查询,法律服务,商业资源 数据概述: 该数据集包含来自加州黄页的数据,记录了加州地区律师的详细信息。主要特征如下:... -
假新闻检测数据集FakeNewsDetectionDataset-ayush0510
假新闻检测数据集FakeNewsDetectionDataset-ayush0510 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,机器学习,自然语言处理,信息检索,社会研究,媒体分析 数据概述:该数据集包含来自Kaggle的假新闻数据,记录了真实和虚假新闻文章的关键信息。主要特征如下:... -
IEEE会议-期刊与新闻文档数据集IEEEConference-JournalandNewsDocumentDataset-towhidultonmoy
IEEE会议-期刊与新闻文档数据集IEEEConference-JournalandNewsDocumentDataset-towhidultonmoy 数据来源:互联网公开数据 标签:学术论文,会议论文,期刊文章,新闻文档,数据集,文献分析,信息检索,机器学习,自然语言处理,学术研究 数据概述:... -
检索系统性能评估数据集RetrieveTop3Dataset-phngnguyndiu
检索系统性能评估数据集RetrieveTop3Dataset-phngnguyndiu 数据来源:互联网公开数据 标签:检索系统,性能评估,数据集,搜索算法,信息检索,机器学习,自然语言处理,搜索引擎优化 数据概述:该数据集包含用于评估搜索系统性能的数据,主要记录了用户检索查询及其对应的前3个检索结果的相关性评分。主要特征如下:... -
Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan
Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述: 该数据集源自Quora平台,记录了平台上用户提出的重复问题及其相关信息。主要特征如下:... -
多领域数据集Multi-domainDataset-amanrajput27
多领域数据集Multi-domainDataset-amanrajput27 数据来源:互联网公开数据 标签:多领域,数据集,文本分类,自然语言处理,机器学习,情感分析,主题建模,信息检索 数据概述: 该数据集整合了来自多个领域和主题的文本数据,旨在为多领域文本分析和机器学习任务提供支持。主要特征如下:... -
额外文件数据集ExtraFilesDataset-nhmquang
额外文件数据集ExtraFilesDataset-nhmquang 数据来源:互联网公开数据 标签:文件分析,数据集,数据挖掘,文本处理,机器学习,数据安全,信息检索,文件类型 数据概述: 该数据集包含了各种文件类型的数据,旨在为文件分析,数据挖掘和机器学习研究提供支持。主要特征如下: 时间跨度:... -
研究主题数据数据集-agimtakon
研究主题数据数据集-agimtakon 数据来源:互联网公开数据 标签:研究主题,数据集,学术研究,数据分析,文献计量学,知识发现,信息检索,主题建模 数据概述:该数据集包含与特定研究主题相关的数据,记录了不同研究领域内的学术文献,研究成果和相关信息。主要特征如下: 时间跨度:数据记录的时间范围可根据具体主题而异,通常涵盖数年至数十年。... -
文章元数据数据集ArticleMeta-dataDataset-gautamsandeep
文章元数据数据集ArticleMeta-dataDataset-gautamsandeep 数据来源:互联网公开数据 标签:元数据,数据集,信息检索,文本分析,自然语言处理,学术研究,知识发现,数据挖掘 数据概述:该数据集包含来自学术文章的元数据,记录了文章的各种信息,如标题,摘要,作者,关键词,出版日期,期刊信息等。主要特征如下:... -
萨斯特拉大学Sastraedu网页爬取邻接表数据集-ashiktcy
萨斯特拉大学Sastraedu网页爬取邻接表数据集-ashiktcy 数据来源:互联网公开数据 标签:网页爬取,邻接表,数据集,网络分析,图数据,信息检索,教育,大学 数据概述: 该数据集包含了从萨斯特拉大学(Sastraedu)官方网站爬取的网页邻接表信息。主要特征如下: 时间跨度:数据爬取时间为[具体爬取时间,例如2024年5月]。... -
自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque
自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque 数据来源:互联网公开数据 标签:自然语言处理,相似度计算,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含用于训练自然语言处理模型的数据,专注于文本相似度计算任务。主要特征如下:... -
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj
文档摘要生成数据集DocumentAbstractiveSummarizationGivenQueryDataset-jastorj 数据来源:互联网公开数据 标签:文档摘要,摘要生成,自然语言处理,机器学习,文本分析,问答系统,数据集,信息检索 数据概述:该数据集包含来自多个来源的文档及其对应的摘要,适用于基于查询的文档摘要生成任务。主要特征如下:... -
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07
自然语言处理生成答案数据集NIRGeneratedAnswersDataset-mrsimple07 数据来源:互联网公开数据 标签:自然语言处理,生成答案,数据集,机器学习,文本分析,人工智能,信息检索,语言模型 数据概述: 该数据集包含由自然语言处理技术生成的答案,适用于对话系统,问答系统等任务。主要特征如下:... -
语义相似度评估数据集LSASimilarityDataset-sagarrathore
语义相似度评估数据集LSASimilarityDataset-sagarrathore 数据来源:互联网公开数据 标签:语义分析,数据集,自然语言处理,文本相似度,机器学习,信息检索,学术研究,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,记录了文本对之间的相似度评分,适用于语义相似度评估,文本聚类等任务。主要特征如下:... -
学术论文标识符数据集ArXivID数据集-bartoszmaj
学术论文标识符数据集ArXivID数据集-bartoszmaj 数据来源:互联网公开数据 标签:学术论文,数据集,标识符,机器学习,自然语言处理,文献管理,知识图谱,信息检索 数据概述:该数据集包含来自ArXiv的学术论文标识符数据,记录了学术论文的唯一标识符(ArXiv ID)。主要特征如下: 时间跨度:数据记录的时间范围从1991年到现代。...