-
扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0
2025年5月30日 30 92 3
扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0 数据来源:互联网公开数据 标签:法律文本,检索,自然语言处理,数据集,信息检索,语义匹配,越南语,人工智能 数据概述: 该数据集由扎罗人工智能(Zalo... -
专利文本相似度预测训练数据集PatentTextSimilarityPredictionTrainingDataset-shobhitupadhyaya
2025年5月29日 30 112 96
专利文本相似度预测训练数据集PatentTextSimilarityPredictionTrainingDataset-shobhitupadhyaya 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义匹配, 机器学习, 专利检索, 文本分类, 深度学习 数据概述:... -
多领域语义匹配数据集MSMARCOModifiedDataset-n068968
2025年5月29日 30 126 56
多领域语义匹配数据集MSMARCOModifiedDataset-n068968 数据来源:互联网公开数据 标签:自然语言处理,语义匹配,数据集,机器学习,信息检索,文本分类,深度学习,数据挖掘 数据概述: 该数据集是对MSMARCO数据集的改进版,包含来自多个领域的语义匹配数据,用于训练和评估文本匹配模型。主要特征如下:... -
大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld
2025年5月19日 30 121 55
大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,负样本,信息检索,语义匹配,深度学习,检索增强 数据概述:... -
文本检索查询匹配数据集TextRetrievalQueryMatchingDataset-tandoganzeynep
2025年5月1日 30 123 45
文本检索查询匹配数据集TextRetrievalQueryMatchingDataset-tandoganzeynep 数据来源:互联网公开数据 标签:文本检索, 信息检索, 语义匹配, 搜索引擎, 文本相似度, 数据集, 机器学习, 文本分析 数据概述: 该数据集包含用于文本检索任务的查询与文档匹配信息。主要特征如下:... -
专利文本相似度评估训练数据集PatentTextSimilarityEvaluationTrainingDataset-khyeh0719
2025年4月29日 30 184 62
专利文本相似度评估训练数据集PatentTextSimilarityEvaluationTrainingDataset-khyeh0719 数据来源:互联网公开数据 标签:专利, 文本相似度, 语义匹配, 机器学习, 文本分类, 数据标注, 自然语言处理, 专利分析 数据概述: 该数据集包含用于训练和评估专利文本相似度模型的结构化数据。主要特征如下:... -
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209
2025年4月29日 30 190 87
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209 数据来源:互联网公开数据 标签:语义匹配, 文本相似度, 自然语言处理, 文本理解, 对比分析, 数据集, 机器学习, 语言模型 数据概述: 该数据集包含来自不同来源的文本对,记录了句子对之间的语义关系。主要特征如下:... -
谷歌专利短语相似性评估数据集-google
2025年4月21日 30 167 22
谷歌专利短语相似性评估数据集-google 数据来源:互联网公开数据 标签:专利,短语相似性,技术术语,语义匹配,短语分类,自然语言处理,机器学习 数据概述:...