-
维基百科主题与类别数据集
2025年6月1日 30 206 112
维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political... -
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集
2025年6月1日 30 96 16
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集 数据来源:互联网公开数据 标签:句子嵌入,多语言,自然语言处理,NLP,机器学习,文本相似度,语义分析,UKPLab 数据概述: 本数据集包含多语言句子嵌入模型DistilUSE-base-multilingual-... -
Unsplash图像数据集及元数据-2023
2025年5月31日 30 9 8
Unsplash图像数据集及元数据-2023 数据来源:互联网公开数据 标签:Unsplash,图像,元数据,关键词,视觉搜索,图像质量,相机,镜头,语义分析,教育,研究 数据概述:... -
教育内容主题与内容相关性分析数据集EducationalContentTopic-ContentRelevanceAnalysis-pingpingniu
2025年5月31日 30 137 13
教育内容主题与内容相关性分析数据集EducationalContentTopic-ContentRelevanceAnalysis-pingpingniu 数据来源:互联网公开数据 标签:教育, 文本匹配, 内容相关性, 机器学习, 知识图谱, 语义分析, 学习资源, 数据标注 数据概述:... -
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109
2025年5月31日 30 44 32
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109 数据来源:互联网公开数据 标签:搜索推荐, 文本匹配, 电商数据, 语义分析, 多语言, 机器学习, 商品搜索, 用户行为 数据概述: 该数据集包含来自电商平台的用户搜索查询与商品信息,记录了用户搜索行为与商品之间的关联性。主要特征如下:... -
人类表型本体HPO相关疾病与基因数据集HumanPhenotypeOntologyHPORelatedDiseaseandGeneDataset-mcasshy
2025年5月31日 30 168 51
人类表型本体HPO相关疾病与基因数据集HumanPhenotypeOntologyHPORelatedDiseaseandGeneDataset-mcasshy 数据来源:互联网公开数据 标签:人类表型本体, HPO, 疾病, 基因, 生物医学, 医疗健康, 语义分析, 数据挖掘 数据概述:... -
学习主题内容关联分析数据集LearningTopicContentAssociationDataset-denissatsuk
2025年5月31日 30 133 81
学习主题内容关联分析数据集LearningTopicContentAssociationDataset-denissatsuk 数据来源:互联网公开数据 标签:教育, 学习, 知识图谱, 文本分析, 内容关联, 自然语言处理, 语义分析, 课程内容 数据概述:... -
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka
2025年5月31日 30 145 130
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 书籍标题, 自然语言处理, 语义分析, 数据降维, 机器学习, 语料库 数据概述: 该数据集包含书籍标题的文本数据及其对应的向量表示,旨在用于文本分析、语义理解和信息检索等任务。主要特征如下:... -
问答事实判断数据集QuestionAnsweringFactVerificationDataset-emam2002
2025年5月30日 30 200 60
问答事实判断数据集QuestionAnsweringFactVerificationDataset-emam2002 数据来源:互联网公开数据 标签:问答系统, 事实核查, 自然语言处理, 文本理解, 机器学习, 语义分析, 语料库, 知识推理 数据概述:... -
多语言文本语义相似度分析数据集MultilingualTextSemanticSimilarityAnalysisDataset-mehtaronit
2025年5月30日 30 205 50
多语言文本语义相似度分析数据集MultilingualTextSemanticSimilarityAnalysisDataset-mehtaronit 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语义分析, 文本匹配, 机器翻译, 自然语言处理, 数据集, 语言识别 数据概述:... -
专利文本语义相似度分析数据集PatentTextSemanticSimilarityAnalysis-banbeipi
2025年5月30日 30 155 94
专利文本语义相似度分析数据集PatentTextSemanticSimilarityAnalysis-banbeipi 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义分析, 文本匹配, 机器学习, 专利检索, 知识产权 数据概述:... -
问答对重复性判定数据集QuestionPairDuplicateDetection-seoltommy
2025年5月30日 30 27 14
问答对重复性判定数据集QuestionPairDuplicateDetection-seoltommy 数据来源:互联网公开数据 标签:自然语言处理, 文本相似度, 问答系统, 文本匹配, 二分类, 深度学习, 语义分析, 数据集 数据概述: 该数据集包含来自问答社区的配对问题数据,用于训练和评估判断问题对之间是否互为重复的二分类模型。主要特征如下:... -
BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan
2025年5月30日 30 2 0
BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本匹配,数据集,机器学习,语义分析,索赔处理,信息检索,人工智能 数据概述:该数据集包含来自多个来源的索赔文本数据,记录了索赔文本及其相似性匹配对,适用于语义匹配和索赔处理任务。主要特征如下:... -
文本嵌入向量处理数据集-mrwynx
2025年5月30日 30 118 100
文本嵌入向量处理数据集-mrwynx 数据来源:互联网公开数据 标签:自然语言处理,文本分析,嵌入向量,数据集,机器学习,语义分析,信息检索,向量空间 数据概述: 该数据集包含了经过处理的文本嵌入向量,旨在用于各种自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不限,取决于原始文本数据的时间范围。... -
孟加拉语文本相似度判断数据集BengaliTextSimilarityDetectionDataset-nilarnabdebnath
2025年5月30日 30 35 33
孟加拉语文本相似度判断数据集BengaliTextSimilarityDetectionDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:文本相似度, 孟加拉语, 自然语言处理, 文本匹配, 语义分析, 二分类, 语料库, 机器翻译 数据概述:... -
文本相似度分析测试数据集TextSimilarityAnalysisTestDataset-polapob
2025年5月30日 30 157 150
文本相似度分析测试数据集TextSimilarityAnalysisTestDataset-polapob 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 文本匹配, 数据集构建, 自然语言处理, 机器学习, 语料库, 向量化 数据概述: 该数据集包含用于测试文本相似度分析的语料,记录了文本对之间的相似度关系。主要特征如下:... -
文本相似度判断训练验证数据集TextSimilarityJudgmentTrainingandValidationDataset-gloriara2
2025年5月30日 30 165 3
文本相似度判断训练验证数据集TextSimilarityJudgmentTrainingandValidationDataset-gloriara2 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 语义分析, 句子对, 文本匹配, 机器学习, 数据集, 文本分类 数据概述:... -
Alura词向量数据集AluraWord2VecDataset-romariogomesbr
2025年5月30日 30 153 23
Alura词向量数据集AluraWord2VecDataset-romariogomesbr 数据来源:互联网公开数据 标签:自然语言处理,词向量,数据集,机器学习,文本分析,深度学习,NLP,语义分析 数据概述: 该数据集包含来自Alura项目的词向量数据,记录了大规模文本语料库中词汇的向量表示。主要特征如下:... -
斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261
2025年5月30日 30 99 8
斯坦福大学自然语言处理课程单词嵌入数据集StanfordNLPCourseWordEmbeddingsDataset-png261 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,斯坦福大学,文本分析,机器学习,深度学习,语义分析 数据概述:... -
自然语言处理与医学词汇标准化数据集NLP-UMLSDataset-quctngngvng
2025年5月30日 30 137 66
自然语言处理与医学词汇标准化数据集NLP-UMLSDataset-quctngngvng 数据来源:互联网公开数据 标签:自然语言处理,医学词汇,数据集,文本挖掘,机器学习,医学信息学,语义分析,临床文档 数据概述: 该数据集包含自然语言处理技术与医学词汇标准化(Unified Medical Language...