-
文本语义相似度评估数据集
2025年7月17日 30 26 10
文本语义相似度评估数据集_Text_Semantic_Similarity_Evaluation 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 信息检索, 模型评估, 深度学习, 自然语言处理, 评估指标, 对比分析 数据概述: 该数据集包含用于评估文本语义相似度模型的训练与评估数据,主要聚焦于信息检索场景下的模型性能分析。主要特征如下:... -
学术论文引用关系与文本分析数据集
2025年7月12日 30 24 3
学术论文引用关系与文本分析数据集_Academic_Paper_Citation_and_Text_Analysis_Dataset 数据来源:互联网公开数据 标签:学术论文, 引用分析, 文本挖掘, 自然语言处理, 论文摘要, 语义分析, 机器学习, 知识图谱 数据概述:... -
文本语义相似度分析祖先节点嵌入向量数据集
2025年7月12日 30 25 2
文本语义相似度分析祖先节点嵌入向量数据集_Text_Semantic_Similarity_Ancestor_Node_Embedding_Vectors 数据来源:互联网公开数据 标签:语义分析, 文本嵌入, 向量表示, 相似度计算, 机器学习, 深度学习, 自然语言处理, 知识图谱 数据概述:... -
Unsplash图片描述与索引数据集_Unsplash_Image_Description_and_Index
2025年6月28日 30 13 8
Unsplash图片描述与索引数据集_Unsplash_Image_Description_and_Index 数据来源:互联网公开数据 标签:图像描述, 图像识别, 计算机视觉, 图像检索, 数据集, 文本-图像, 语义分析, 图像标注 数据概述: 该数据集包含来自Unsplash平台的图片数据,记录了图片描述信息与对应的图片文件。主要特征如下:... -
文本质量评估多维度分析数据集_Text_Quality_Evaluation_Multi_dimensional_Analysis_Dataset
2025年6月28日 30 26 3
文本质量评估多维度分析数据集_Text_Quality_Evaluation_Multi_dimensional_Analysis_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言评估, 机器学习, 自然语言处理, 文本质量, 语义分析, 写作质量, 多模态数据 数据概述:... -
维基百科主题与类别数据集
2025年6月1日 30 28 2
维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political... -
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集
2025年6月1日 30 12 1
多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集 数据来源:互联网公开数据 标签:句子嵌入,多语言,自然语言处理,NLP,机器学习,文本相似度,语义分析,UKPLab 数据概述: 本数据集包含多语言句子嵌入模型DistilUSE-base-multilingual-... -
Unsplash图像数据集及元数据-2023
2025年5月31日 30 22 4
Unsplash图像数据集及元数据-2023 数据来源:互联网公开数据 标签:Unsplash,图像,元数据,关键词,视觉搜索,图像质量,相机,镜头,语义分析,教育,研究 数据概述:... -
教育内容主题与内容相关性分析数据集EducationalContentTopic-ContentRelevanceAnalysis-pingpingniu
2025年5月31日 30 17 8
教育内容主题与内容相关性分析数据集EducationalContentTopic-ContentRelevanceAnalysis-pingpingniu 数据来源:互联网公开数据 标签:教育, 文本匹配, 内容相关性, 机器学习, 知识图谱, 语义分析, 学习资源, 数据标注 数据概述:... -
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109
2025年5月31日 30 27 1
商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109 数据来源:互联网公开数据 标签:搜索推荐, 文本匹配, 电商数据, 语义分析, 多语言, 机器学习, 商品搜索, 用户行为 数据概述: 该数据集包含来自电商平台的用户搜索查询与商品信息,记录了用户搜索行为与商品之间的关联性。主要特征如下:... -
人类表型本体HPO相关疾病与基因数据集HumanPhenotypeOntologyHPORelatedDiseaseandGeneDataset-mcasshy
2025年5月31日 30 15 10
人类表型本体HPO相关疾病与基因数据集HumanPhenotypeOntologyHPORelatedDiseaseandGeneDataset-mcasshy 数据来源:互联网公开数据 标签:人类表型本体, HPO, 疾病, 基因, 生物医学, 医疗健康, 语义分析, 数据挖掘 数据概述:... -
学习主题内容关联分析数据集LearningTopicContentAssociationDataset-denissatsuk
2025年5月31日 30 10 6
学习主题内容关联分析数据集LearningTopicContentAssociationDataset-denissatsuk 数据来源:互联网公开数据 标签:教育, 学习, 知识图谱, 文本分析, 内容关联, 自然语言处理, 语义分析, 课程内容 数据概述:... -
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka
2025年5月31日 30 12 8
书籍标题文本向量数据集BookTitleTextVectorDataset-minorumorioka 数据来源:互联网公开数据 标签:文本向量化, 词嵌入, 书籍标题, 自然语言处理, 语义分析, 数据降维, 机器学习, 语料库 数据概述: 该数据集包含书籍标题的文本数据及其对应的向量表示,旨在用于文本分析、语义理解和信息检索等任务。主要特征如下:... -
问答事实判断数据集QuestionAnsweringFactVerificationDataset-emam2002
2025年5月30日 30 25 5
问答事实判断数据集QuestionAnsweringFactVerificationDataset-emam2002 数据来源:互联网公开数据 标签:问答系统, 事实核查, 自然语言处理, 文本理解, 机器学习, 语义分析, 语料库, 知识推理 数据概述:... -
多语言文本语义相似度分析数据集MultilingualTextSemanticSimilarityAnalysisDataset-mehtaronit
2025年5月30日 30 14 9
多语言文本语义相似度分析数据集MultilingualTextSemanticSimilarityAnalysisDataset-mehtaronit 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语义分析, 文本匹配, 机器翻译, 自然语言处理, 数据集, 语言识别 数据概述:... -
专利文本语义相似度分析数据集PatentTextSemanticSimilarityAnalysis-banbeipi
2025年5月30日 30 11 9
专利文本语义相似度分析数据集PatentTextSemanticSimilarityAnalysis-banbeipi 数据来源:互联网公开数据 标签:专利, 文本相似度, 自然语言处理, 语义分析, 文本匹配, 机器学习, 专利检索, 知识产权 数据概述:... -
问答对重复性判定数据集QuestionPairDuplicateDetection-seoltommy
2025年5月30日 30 12 9
问答对重复性判定数据集QuestionPairDuplicateDetection-seoltommy 数据来源:互联网公开数据 标签:自然语言处理, 文本相似度, 问答系统, 文本匹配, 二分类, 深度学习, 语义分析, 数据集 数据概述: 该数据集包含来自问答社区的配对问题数据,用于训练和评估判断问题对之间是否互为重复的二分类模型。主要特征如下:... -
BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan
2025年5月30日 30 13 4
BERT语义匹配索赔数据集Sim-BERTClaimDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本匹配,数据集,机器学习,语义分析,索赔处理,信息检索,人工智能 数据概述:该数据集包含来自多个来源的索赔文本数据,记录了索赔文本及其相似性匹配对,适用于语义匹配和索赔处理任务。主要特征如下:... -
文本嵌入向量处理数据集-mrwynx
2025年5月30日 30 21 8
文本嵌入向量处理数据集-mrwynx 数据来源:互联网公开数据 标签:自然语言处理,文本分析,嵌入向量,数据集,机器学习,语义分析,信息检索,向量空间 数据概述: 该数据集包含了经过处理的文本嵌入向量,旨在用于各种自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不限,取决于原始文本数据的时间范围。... -
孟加拉语文本相似度判断数据集BengaliTextSimilarityDetectionDataset-nilarnabdebnath
2025年5月30日 30 24 4
孟加拉语文本相似度判断数据集BengaliTextSimilarityDetectionDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:文本相似度, 孟加拉语, 自然语言处理, 文本匹配, 语义分析, 二分类, 语料库, 机器翻译 数据概述:...