-
语义相似度文本对数据集SemanticSimilarityTextPairDataset-krishna21058
语义相似度文本对数据集SemanticSimilarityTextPairDataset-krishna21058 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 自然语言处理, 文本对, 机器翻译, 深度学习, 语料库, 数据集 数据概述: 该数据集包含来自公开渠道的文本对数据,记录了句子对之间的语义相似度评分。主要特征如下:... -
文本语义相似度评估训练数据集TextualSemanticSimilarityEvaluationTrainingDataset-eshuenglish
文本语义相似度评估训练数据集TextualSemanticSimilarityEvaluationTrainingDataset-eshuenglish 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 自然语言处理, 深度学习, 文本分析, 语料库, 训练数据, 相似度评估 数据概述:... -
多语言文本嵌入模型训练数据集MultilingualTextEmbeddingModelTrainingData-miller90
多语言文本嵌入模型训练数据集MultilingualTextEmbeddingModelTrainingData-miller90 数据来源:互联网公开数据 标签:文本嵌入, 多语言, 语义相似度, 文本表示, 预训练模型, 自然语言处理, 机器学习, 模型训练 数据概述:... -
专利文本相关性预测数据集PatentTextRelevancePredictionDataset-liuyer
专利文本相关性预测数据集PatentTextRelevancePredictionDataset-liuyer 数据来源:互联网公开数据 标签:专利, 文本匹配, 自然语言处理, 语义相似度, 文本分类, 机器学习, 技术领域, 文本分析 数据概述:... -
法律文书检索数据集LegalRetrievalCorpus-nhutchung
法律文书检索数据集LegalRetrievalCorpus-nhutchung 数据来源:互联网公开数据 标签:法律,检索,数据集,文本分析,自然语言处理,信息检索,语义相似度,司法 数据概述: 该数据集包含来自法律文书的数据,主要用于法律文书的检索和相关研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于具体收录的法律文书。... -
专利短语匹配数据集PatentPhrasetoPhraseMatching-searchone
专利短语匹配数据集PatentPhrasetoPhraseMatching-searchone 数据来源:互联网公开数据 标签:专利, 自然语言处理, 文本匹配, 语义相似度, 文本分析, 机器学习, 专利检索, 数据集 数据概述:... -
文本语义相似度计算嵌入向量数据集TextSemanticSimilarityEmbeddingVectors-erkhatkalkabay
文本语义相似度计算嵌入向量数据集TextSemanticSimilarityEmbeddingVectors-erkhatkalkabay 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 向量表示, 机器学习, 自然语言处理, 数据分析, 文本分析, 预训练模型 数据概述:... -
跨编码器训练数据2万条-2023年12月数据集-ictworld
跨编码器训练数据2万条-2023年12月数据集-ictworld 数据来源:互联网公开数据 标签:自然语言处理,数据集,跨编码器,文本匹配,语义相似度,信息检索,机器学习,文本分析 数据概述: 该数据集包含2万条用于训练跨编码器的文本数据,旨在提升模型在语义相似度计算、文本匹配和信息检索等任务上的表现。主要特征如下:... -
维基百科词条向量化数据集WikipediaTermVectorizationDataset-darkmistress
维基百科词条向量化数据集WikipediaTermVectorizationDataset-darkmistress 数据来源:互联网公开数据 标签:词向量, 文本分析, 机器学习, 知识图谱, 语义相似度, 降维, 自然语言处理, 维基百科 数据概述:... -
专利文本相关性分析训练数据集PatentTextRelevanceAnalysisTrainingDataset-helloggfss
专利文本相关性分析训练数据集PatentTextRelevanceAnalysisTrainingDataset-helloggfss 数据来源:互联网公开数据 标签:专利分析, 文本匹配, 自然语言处理, 文本分类, 语义相似度, 数据标注, 机器学习, 专利检索 数据概述:... -
专利短语匹配数据集PatentPhraseMatching-niuguluying
专利短语匹配数据集PatentPhraseMatching-niuguluying 数据来源:互联网公开数据 标签:专利, 文本匹配, 自然语言处理, 语义相似度, 专利检索, 文本分析, 机器学习, 信息检索 数据概述: 该数据集包含来自美国专利文献的数据,记录了专利申请中的短语对,用于训练模型以判断短语之间的语义相似度。主要特征如下:... -
专利文本语义相关性评估数据集PatentTextSemanticRelatednessEvaluation-datafan07
专利文本语义相关性评估数据集PatentTextSemanticRelatednessEvaluation-datafan07 数据来源:互联网公开数据 标签:专利, 文本匹配, 语义相似度, 自然语言处理, 文本分析, 机器学习, 专利检索, 文本向量化 数据概述:... -
越南语医学问答文档检索数据集VietnameseMedicalQuestionAnsweringDocumentRetrieval-phngnguyndiu
越南语医学问答文档检索数据集VietnameseMedicalQuestionAnsweringDocumentRetrieval-phngnguyndiu 数据来源:互联网公开数据 标签:信息检索, 问答系统, 越南语, 医学, BM25, 语义相似度, 混合检索, 自然语言处理 数据概述:... -
问答系统语义相似度匹配数据集QuestionAnsweringSystemSemanticSimilarityMatchingDataset-shadowcattin
问答系统语义相似度匹配数据集QuestionAnsweringSystemSemanticSimilarityMatchingDataset-shadowcattin 数据来源:互联网公开数据 标签:语义相似度, 问答系统, 文本匹配, 数据标注, 自然语言处理, 文本分类, 语料库, 信息检索 数据概述:... -
中文文本相似度判别数据集ChineseTextSimilarityJudgementDataset-danyang10425
中文文本相似度判别数据集ChineseTextSimilarityJudgementDataset-danyang10425 数据来源:互联网公开数据 标签:文本匹配, 语义相似度, 自然语言处理, 文本分类, 对话理解, 机器学习, 语料库, 情感分析 数据概述:... -
用户反馈语义相似度分析数据集UserFeedbackSemanticSimilarityAnalysisDataset-prosperchuks
用户反馈语义相似度分析数据集UserFeedbackSemanticSimilarityAnalysisDataset-prosperchuks 数据来源:互联网公开数据 标签:语义相似度,情感分析,用户反馈,文本分类,自然语言处理,机器学习,文本匹配,标注数据 数据概述:... -
图像描述文本改写数据集ImageCaptionParaphrasing-zeindea
图像描述文本改写数据集ImageCaptionParaphrasing-zeindea 数据来源:互联网公开数据 标签:图像描述, 文本改写, 自然语言处理, 语义相似度, 图像识别, 文本生成, 深度学习, 数据增强 数据概述: 该数据集包含来自图像描述的数据,记录了针对同一张图像的不同描述文本。主要特征如下:... -
多语言平行文本语义相似度评估数据集MultilingualParallelTextSemanticSimilarityEvaluationDataset-...
多语言平行文本语义相似度评估数据集MultilingualParallelTextSemanticSimilarityEvaluationDataset-hemangkhatri07 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 多语言, 机器翻译, 文本分析, 印度语, 英语, 文本对齐 数据概述:... -
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05 数据来源:互联网公开数据 标签:语义相似度, 文本理解, 自然语言处理, 句子对, 情感分析, 机器翻译, 文本匹配, 数据集 数据概述: 该数据集包含来自多个来源的文本对,记录了句子之间的语义相似度信息。主要特征如下:... -
越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai
越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai 数据来源:互联网公开数据 标签:语义相似度, 越南语, 英语, 文本匹配, 自然语言处理, 机器翻译, 双语语料, 文本对 数据概述: 该数据集包含越南语-...