找到13个数据集

格式: ZIP 标签: 语义匹配

过滤结果
  • TRADE_Based_广告理解对抗性诊断测试集_2024

    2026年1月30日 30 208 58

    数据集概述 本数据集为TRADE(TRuly ADversarial ad understanding Evaluation)诊断测试集,包含从Pitt Ads数据集中随机选取的300个基于图像的广告,每个广告关联1个有效解释和2个对抗性负向解释,用于评估多模态模型的广告理解能力,共3个文件。 文件详解...
    packageimg
  • ORKG_Based_开放研究知识图谱_模板推荐_内容推荐数据集

    2026年1月28日 30 185 148

    数据集概述 本数据集用于在开放研究知识图谱(ORKG)中实现基于内容的推荐系统,输入研究论文标题和摘要,推荐语义相关的现有模板。包含一个通用数据集、两种方法的训练集、监督方法验证集及两种方法的测试集,支持自然语言推理(NLI)和无监督推荐模型训练与评估。 文件详解 dataset.json(JSON格式) 包含templates列表和neutral...
    packageimg
  • Wikidata_Based_新闻标题到知识图谱事件类映射评估数据集

    2026年1月25日 30 126 32

    数据集概述 本数据集是基于Wikidata构建的新闻标题到事件类映射语料库,用于支持新闻标题与知识图谱中事件类的关联评估框架研究。数据集包含1个JSON文件,无训练测试、数据标签或原始处理数据的拆分,为新闻事件分类映射任务提供基础数据支持。 文件详解 文件名称:news_event_identication_dataset.json 文件格式:JSON...
    packageimg
  • 酒店评论相关性检索评估数据集_FRUCE

    2025年12月21日 30 93 91

    数据集概述 该数据集是一个信息检索(IR)系统评估集合,专为酒店用户评论的相关性检索任务设计,包含查询-评论对及其二元相关性标注,区别于传统以文档为单位的评估集合。 文件详解 文件名称: Finding Relevant User Comments Evaluation Collection.html 文件格式: HTML 内容说明:...
    packageimg
  • ARASAAC黑白象形图数据集第七部分

    2025年12月8日 30 194 136

    数据集概述 该数据集为ARASAAC黑白象形图系列的第七部分,包含一千张由Sergio Palao创建的黑白PNG格式象形图,覆盖生物学、医学、图像视觉等多领域语义主题,无目录层级与数据划分。 文件详解 核心文件: 共一千个PNG格式文件,均为黑白象形图,无目录结构 文件示例:...
    packageimg
  • 扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0

    2025年5月30日 30 16 3

    扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0 数据来源:互联网公开数据 标签:法律文本,检索,自然语言处理,数据集,信息检索,语义匹配,越南语,人工智能 数据概述: 该数据集由扎罗人工智能(Zalo...
    packageimg
  • 专利文本相似度预测训练数据集PatentTextSimilarityPredictionTrainingDataset-shobhitupadhyaya

    2025年5月29日 30 64 62

    专利文本相似度预测训练数据集PatentTextSimilarityPredictionTrainingDataset-shobhitupadhyaya 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义匹配, 机器学习, 专利检索, 文本分类, 深度学习 数据概述:...
    packageimg
  • 多领域语义匹配数据集MSMARCOModifiedDataset-n068968

    2025年5月29日 30 182 110

    多领域语义匹配数据集MSMARCOModifiedDataset-n068968 数据来源:互联网公开数据 标签:自然语言处理,语义匹配,数据集,机器学习,信息检索,文本分类,深度学习,数据挖掘 数据概述: 该数据集是对MSMARCO数据集的改进版,包含来自多个领域的语义匹配数据,用于训练和评估文本匹配模型。主要特征如下:...
    packageimg
  • 大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld

    2025年5月19日 30 40 9

    大规模问答负样本数据集20kQuerieswithTop10Negatives-ictworld 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,负样本,信息检索,语义匹配,深度学习,检索增强 数据概述:...
    packageimg
  • 文本检索查询匹配数据集TextRetrievalQueryMatchingDataset-tandoganzeynep

    2025年5月1日 30 8 2

    文本检索查询匹配数据集TextRetrievalQueryMatchingDataset-tandoganzeynep 数据来源:互联网公开数据 标签:文本检索, 信息检索, 语义匹配, 搜索引擎, 文本相似度, 数据集, 机器学习, 文本分析 数据概述: 该数据集包含用于文本检索任务的查询与文档匹配信息。主要特征如下:...
    packageimg
  • 专利文本相似度评估训练数据集PatentTextSimilarityEvaluationTrainingDataset-khyeh0719

    2025年4月29日 30 34 6

    专利文本相似度评估训练数据集PatentTextSimilarityEvaluationTrainingDataset-khyeh0719 数据来源:互联网公开数据 标签:专利, 文本相似度, 语义匹配, 机器学习, 文本分类, 数据标注, 自然语言处理, 专利分析 数据概述: 该数据集包含用于训练和评估专利文本相似度模型的结构化数据。主要特征如下:...
    packageimg
  • 文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209

    2025年4月29日 30 64 63

    文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209 数据来源:互联网公开数据 标签:语义匹配, 文本相似度, 自然语言处理, 文本理解, 对比分析, 数据集, 机器学习, 语言模型 数据概述: 该数据集包含来自不同来源的文本对,记录了句子对之间的语义关系。主要特征如下:...
    packageimg
  • 谷歌专利短语相似性评估数据集-google

    2025年4月21日 30 203 14

    谷歌专利短语相似性评估数据集-google 数据来源:互联网公开数据 标签:专利,短语相似性,技术术语,语义匹配,短语分类,自然语言处理,机器学习 数据概述:...
    packageimg