-
商品相似度匹配结果数据集ProductSimilarityMatchingResults-sofaking1998
商品相似度匹配结果数据集ProductSimilarityMatchingResults-sofaking1998 数据来源:互联网公开数据 标签:商品匹配, 相似度分析, 电商, 文本匹配, 数据挖掘, 推荐系统, 机器学习, 评估指标 数据概述: 该数据集包含商品ID及其对应的匹配结果,记录了在特定电商平台上的商品相似度匹配情况。主要特征如下:... -
新闻标题与文章立场关系分析数据集NewsHeadlineandArticleStanceAnalysis-aamathur02
新闻标题与文章立场关系分析数据集NewsHeadlineandArticleStanceAnalysis-aamathur02 数据来源:互联网公开数据 标签:新闻分析,立场分析,文本匹配,自然语言处理,信息检索,观点挖掘,二元关系,文本分类 数据概述:... -
专利文本关键词关联分析训练数据集PatentTextKeywordAssociationAnalysisTrainingDataset-amitabhphatak
专利文本关键词关联分析训练数据集PatentTextKeywordAssociationAnalysisTrainingDataset-amitabhphatak 数据来源:互联网公开数据 标签:专利分析, 文本匹配, 关键词提取, 关联分析, 自然语言处理, 机器学习, 数据标注, 专利检索 数据概述:... -
文本语义相似度分析数据集TextSemanticSimilarityAnalysisDataset-datafan07
文本语义相似度分析数据集TextSemanticSimilarityAnalysisDataset-datafan07 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 信息检索, 深度学习, 自然语言处理, 对比分析, 文本理解, 机器阅读 数据概述:... -
AI竞赛DAIGT文本生成检测数据集
AI竞赛DAIGT文本生成检测数据集 数据来源:互联网公开数据 标签:文本生成, AI检测, 竞赛数据, 自然语言处理, 逆向工程, 替换映射, 文本匹配 数据概述:... -
模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67
模糊匹配输出数据集FuzzyWuzzyOutputDataset-leed67 数据来源:互联网公开数据 标签:模糊匹配,相似度分析,数据集,自然语言处理,文本匹配,文本处理,数据清洗,人工智能 数据概述: 该数据集包含使用FuzzyWuzzy库进行文本相似度匹配的输出结果,记录了不同文本字符串之间的相似度分数。主要特征如下:... -
SIAM-SES句子相似度数据集0-50-2-emam2002
SIAM-SES句子相似度数据集0-50-2-emam2002 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,语义分析,机器学习,中文,情感分析,文本匹配 数据概述: 该数据集包含来自 SIAM-SES 的中文句子对,用于评估句子间的语义相似度。主要特征如下: 时间跨度:数据记录时间不明确,但数据集本身为静态数据。... -
Quora问答对语义相似度预测数据集
Quora问答对语义相似度预测数据集 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,问答对,文本匹配,机器学习,Quora,Kaggle,文本分析 数据概述: 本数据集源自Kaggle竞赛Quora问答对,用于预测给定的问答对中,哪一对问题具有相同的含义。 数据集包含了大量Quora平台上的问题对,每个问题对都标注了它们是否语义相似。... -
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806
微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806 数据来源:互联网公开数据 标签:机器阅读理解,文档检索,数据集,自然语言处理,信息检索,深度学习,文本匹配,问答系统 数据概述: 该数据集由微软发布,旨在促进机器阅读理解和文档检索领域的研究。数据集的核心是查询-... -
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers
跨编码器训练数据4K数据集Cross-EncoderTrainingData4KDataset-ictunivers 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,跨编码器,语义理解,机器学习,深度学习,文本匹配 数据概述: 该数据集包含用于训练跨编码器模型的大量文本数据,旨在提升模型在语义理解和文本匹配方面的性能。主要特征如下:... -
电视节目剧集评论与剧集摘要匹配数据集2021-bobotran
电视节目剧集评论与剧集摘要匹配数据集2021-bobotran 数据来源:互联网公开数据 标签:剧集评论,剧集摘要,电视节目,spoiler检测,文本匹配,语义分析,教育,科研 数据概述:... -
杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh
杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,模型训练,BART,文本匹配,语言模型,人工智能 数据概述: 该数据集包含杰布·普罗姆特(JB... -
WikiQA开放域问答数据集-问题与句子对-开放域问答研究
WikiQA开放域问答数据集-问题与句子对-开放域问答研究 数据来源:互联网公开数据 标签:问答系统,自然语言处理,文本匹配,信息检索,知识库,开放域问答,WikiQA,机器学习,数据集 数据概述:...