找到148个数据集

标签: 文本相似度

过滤结果
  • BM25基础训练集数据集-danielphalen

    2025年4月24日   

    BM25基础训练集数据集-danielphalen 数据来源:互联网公开数据 标签:信息检索,文本处理,数据集,自然语言处理,BM25,搜索算法,文本相似度,机器学习 数据概述:该数据集包含用于训练和评估BM25(Best Match 25)模型的文本数据,主要用于信息检索任务。主要特征如下: 时间跨度:数据涵盖了从特定时间段内收集的文本数据。...
    packageimg
  • 数据2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin

    2025年4月24日   

    2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,语义分析,人工智能,语言模型,情感分析 数据概述: 该数据集由阿里巴巴提供,专注于自然语言处理中的文本相似度任务。主要特征如下: 时间跨度:数据记录的时间范围为2018年。...
    packageimg
  • Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang

    2025年4月24日   

    Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang 数据来源:互联网公开数据 标签:问答配对,数据集,自然语言处理,文本相似度,机器学习,数据挖掘,信息检索,知识图谱 数据概述: 该数据集包含来自Quora问答平台的配对问题数据,记录了成对的问题及其相似性标签。主要特征如下:...
    packageimg
  • SIAM-SES句子相似度数据集0-50-2-emam2002

    2025年4月24日   

    SIAM-SES句子相似度数据集0-50-2-emam2002 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,语义分析,机器学习,中文,情感分析,文本匹配 数据概述: 该数据集包含来自 SIAM-SES 的中文句子对,用于评估句子间的语义相似度。主要特征如下: 时间跨度:数据记录时间不明确,但数据集本身为静态数据。...
    packageimg
  • Quora问答平台问题重复识别数据集

    2025年4月19日   

    Quora问答平台问题重复识别数据集 数据来源:互联网公开数据 标签:问答平台,自然语言处理,机器学习,文本相似度,重复问题,Quora,语义分析 数据概述:...
    packageimg
  • SentEval句子嵌入评估工具包数据集

    2025年4月19日   

    SentEval句子嵌入评估工具包数据集 数据来源:互联网公开数据 标签:自然语言处理, 句子嵌入, 评估, 文本相似度, 情感分析, 语义理解, 迁移学习, 语言学探针 数据概述:...
    packageimg
  • 自然语言推理数据集

    2025年4月17日   

    自然语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,句子理解,文本相似度,文本蕴含,语义分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • Quora平台重复问题识别数据集

    2025年4月15日   

    Quora平台重复问题识别数据集 数据来源:互联网公开数据 标签:Quora,问答平台,重复问题,自然语言处理,文本相似度,数据挖掘,用户体验 数据概述:...
    packageimg