-
维基百科页面信息数据集WikipediaPageInformationDataset-mugentk
维基百科页面信息数据集WikipediaPageInformationDataset-mugentk 数据来源:互联网公开数据 标签:维基百科,数据集,文本分析,自然语言处理,知识图谱,信息检索,数据挖掘,语义分析 数据概述: 该数据集包含来自维基百科的页面信息,记录了维基百科中各个页面的详细信息。主要特征如下:... -
搜索关键词分类数据集-jahangirraina
搜索关键词分类数据集-jahangirraina 数据来源:互联网公开数据 标签:文本分类,关键词分析,自然语言处理,数据集,机器学习,信息检索,数据挖掘,语义分析 数据概述: 该数据集包含大量搜索关键词及其对应的分类标签,用于训练和评估文本分类模型。主要特征如下: 时间跨度:数据无明确的时间范围,通常为近期收集的关键词。... -
自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque
自然语言处理与相似度计算训练数据集ParmexTrainSpaCySimilarityDataset-agmeque 数据来源:互联网公开数据 标签:自然语言处理,相似度计算,数据集,文本分析,机器学习,深度学习,语义分析,信息检索 数据概述: 该数据集包含用于训练自然语言处理模型的数据,专注于文本相似度计算任务。主要特征如下:... -
语义相似度评估数据集LSASimilarityDataset-sagarrathore
语义相似度评估数据集LSASimilarityDataset-sagarrathore 数据来源:互联网公开数据 标签:语义分析,数据集,自然语言处理,文本相似度,机器学习,信息检索,学术研究,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,记录了文本对之间的相似度评分,适用于语义相似度评估,文本聚类等任务。主要特征如下:... -
古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id
古兰经分段数据集Gen-Ref-SegmentedQuranDataset-abdo3id 数据来源:互联网公开数据 标签:古兰经,数据集,文本分析,伊斯兰教,自然语言处理,语义分析,宗教研究,文本挖掘 数据概述: 该数据集包含经过分段处理的古兰经文本,旨在为文本分析和自然语言处理研究提供支持。主要特征如下:... -
新闻文章内容相似度分析矩阵数据集-manishkumar866115
新闻文章内容相似度分析矩阵数据集-manishkumar866115 数据来源:互联网公开数据 标签:新闻,文本分析,相似度,自然语言处理,机器学习,信息检索,文本挖掘,语义分析 数据概述: 该数据集包含新闻文章内容相似度分析矩阵数据,记录了不同新闻文章之间的相似度得分。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于新闻文章的发布时间。... -
元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018
元数据管理与知识图谱构建数据集MetzooPR2Dataset-eltongas2018 数据来源:互联网公开数据 标签:数据管理,知识图谱,元数据,数据集,信息检索,机器学习,语义分析,数据处理 数据概述: 该数据集由Metzoo项目提供,专注于元数据管理和知识图谱构建任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。... -
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:... -
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto
图八标注文本数据集Figure-EightLabelledTextualDataset-manuelbenedicto 数据来源:互联网公开数据 标签:文本标注,数据集,自然语言处理,机器学习,数据挖掘,语义分析,人工智能,信息提取 数据概述: 该数据集由图八公司(Figure-... -
英文文本意图分类数据集IntentClassificationDataset-jooni22
英文文本意图分类数据集IntentClassificationDataset-jooni22 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,意图识别,语义分析,人工智能,NLP 数据概述: 该数据集包含了用于英文文本意图分类任务的标注数据,旨在帮助研究人员和开发者训练和评估文本意图识别模型。主要特征如下:... -
词义消歧数据集WSDData-abdelrahmanelbakouri
词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,... -
瓦里纳情绪词汇数据集VADRatingsWarrinerDataset-josien
瓦里纳情绪词汇数据集VADRatingsWarrinerDataset-josien 数据来源:互联网公开数据 标签:情感分析,情绪词汇,数据集,心理学,自然语言处理,词汇评价,语义分析,机器学习 数据概述: 该数据集由瓦里纳等人收集和整理,包含了大量英语词汇的情感评分数据,用于情绪分析和情感计算研究。主要特征如下:... -
斯坦福情感树数据集SST5Dataset-mercyfausty
斯坦福情感树数据集SST5Dataset-mercyfausty 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分类,深度学习,情感识别,NLP,语义分析 数据概述: 该数据集来自斯坦福大学,主要用于情感分析任务,包含了电影评论的细粒度情感标注。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了电影评论的时间范围。... -
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15 数据来源:互联网公开数据 标签:问答平台,自然语言处理,数据集,文本分析,机器学习,语义分析,社交媒体,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题数据,记录了用户提出的各种问题及其相关信息。主要特征如下:... -
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale
关键词与句子关系分析数据集Keyword-SentencesDataset-maheshwarbhosale 数据来源:互联网公开数据 标签:自然语言处理,关键词提取,句子分析,数据集,文本挖掘,机器学习,语义分析,信息检索 数据概述: 该数据集包含关键词与句子之间的关系数据,记录了关键词在句子中的出现位置,语义关联等信息。主要特征如下:... -
数据2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin
2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,语义分析,人工智能,语言模型,情感分析 数据概述: 该数据集由阿里巴巴提供,专注于自然语言处理中的文本相似度任务。主要特征如下: 时间跨度:数据记录的时间范围为2018年。... -
法律文本自然语言推理数据集LegalLensNLIDataset-nhddddz84
法律文本自然语言推理数据集LegalLensNLIDataset-nhddddz84 数据来源:互联网公开数据 标签:法律文本,自然语言推理,数据集,法律研究,机器学习,语义分析,人工智能,文本分类 数据概述: 该数据集包含来自法律文本的自然语言推理(NLI)数据,记录了法律文档中的前提语句和假设语句及其之间的推理关系。主要特征如下:... -
词向量模型数据集GloVe-mlethics
词向量模型数据集GloVe-mlethics 数据来源:互联网公开数据 标签:词向量,自然语言处理,文本分析,机器学习,深度学习,语义分析,词嵌入,NLP 数据概述: 该数据集包含了由斯坦福大学开发的GloVe(Global Vectors for Word Representation)词向量模型。主要特征如下:... -
古兰经文本数据集QuranKareemTextDataset-mohamedeldesouky
古兰经文本数据集QuranKareemTextDataset-mohamedeldesouky 数据来源:互联网公开数据 标签:伊斯兰教,古兰经,文本分析,自然语言处理,宗教研究,阿拉伯语,数据集,语义分析 数据概述: 该数据集包含了古兰经的阿拉伯语原文及其翻译,是研究伊斯兰教文本和进行自然语言处理的重要资源。主要特征如下: 时间跨度:... -
自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah
自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语义分析,文本挖掘,语言学,人工智能 数据概述:该数据集包含来自多个来源的文本数据,涵盖了各种类型的文本,适用于自然语言处理和机器学习等任务。主要特征如下:...