找到74个数据集

格式: ZIP 标签: 语义相似度

过滤结果
  • 进化表型黄金标准语料库与实体质量本体注释数据集

    2025年12月22日 30 164 1

    数据集概述 本数据集包含进化表型描述的黄金标准语料库(源自系统发育研究的特征状态描述)及专家标注的实体质量(EQ)本体注释,可支持机器推理以量化表型描述的语义相似度,同时包含相关本体文件及用于评估机器标注工具性能的人工与机器生成注释。 文件详解 文档类文件: README.md:Markdown格式,说明数据集核心内容、结构及使用背景 Author-...
    packageimg
  • 数据73种语言句子级释义语料库TaPaCo

    2025年12月22日 30 178 42

    数据集概述 该数据集为73种语言的句子级释义语料库TaPaCo,从Tatoeba数据库提取,经语言无关过滤和修剪步骤处理。含约190万句,每种语言20万至25万句,覆盖无其他释义数据集的语言,部分语言人工评估显示半数至四分之三释义正确。 文件详解 文件名称: tapaco_v1.0.zip:压缩包格式,包含73种语言的句子级释义语料库数据 文件名称:...
    packageimg
  • SemEval_2020任务3_语境中分级词相似度数据集

    2025年12月21日 30 111 63

    数据集概述 该数据集为SemEval-2020任务3的研究资料,核心内容是探究语境对人类感知词相似度的影响,重点关注语境带来的连续(分级)语义变化,而非仅多义词的离散义项差异。数据集包含标注者对段落语境中词对相似度的评分数据,支持分析语境导致的相似度变化。 文件详解 文档文件:...
    packageimg
  • 基于大语言模型的威胁启发工具比较基准研究复现包

    2025年12月10日 30 131 25

    数据集概述 本数据集是支持《基于大语言模型的威胁启发工具比较基准研究》的复现包,包含基线构建、工具输出、威胁模型评估比较及F1分数、冗余度等详细结果,还补充了指令影响、语义相似度阈值测试等验证结果。 文件详解 文件名称: dvanlanduyt_fgcs_replication-package.zip 文件格式: ZIP(压缩包) 包含内容:...
    packageimg
  • 佛教梵语嵌入模型评估数据集

    2025年12月4日 30 16 9

    数据集概述 本数据集为佛教梵语嵌入模型研究的评估数据集,包含语义相似度数据集、类比任务数据集,以及研究论文和标注指南文档,用于支持佛教梵语文本处理模型的性能评估。 文件详解 文件名称: ReadMe.txt 文件格式: TXT 内容: 包含语义相似度评分指南,定义0-6分的评分标准(从无关联到完全同义词),以及人工标注任务说明 文件名称:...
    packageimg
  • WNSimRep本体语义相似度度量与信息内容模型复制数据集

    2025年11月27日 30 207 10

    数据集概述 该数据集是HESML软件库配套的复制数据集,基于WordNet 3.0构建,包含节点型、边型、同义词集对型三类数据文件,覆盖内在及语料库基信息内容模型与本体语义相似度度量,支持文献中相关模型的精确复现。 文件详解 压缩数据包:...
    packageimg
  • 语义相似度评估模型数据集

    2025年11月5日 30 143 18

    语义相似度评估模型数据集_Semantic_Similarity_Evaluation_Model_Dataset 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 自然语言处理, 深度学习, 模型评估, 文本分析, 预训练模型, 相似度计算 数据概述:...
    packageimg
  • 文本语义相似度分析嵌入向量数据集

    2025年11月2日 30 3 0

    文本语义相似度分析嵌入向量数据集_Text_Semantic_Similarity_Analysis_Embedding_Vectors 数据来源:互联网公开数据 标签:文本分析, 语义相似度, 嵌入向量, 机器学习, 自然语言处理, 文本表示, 模型训练, 数据集 数据概述:...
    packageimg
  • 语义文本嵌入向量数据集

    2025年11月1日 30 42 21

    语义文本嵌入向量数据集_Semantic_Text_Embedding_Vectors 数据来源:互联网公开数据 标签:文本嵌入, 语义相似度, 向量化, 自然语言处理, 深度学习, 文本检索, 知识图谱, 数据集 数据概述: 该数据集包含基于多问答场景下,使用DistilBERT模型生成的文本嵌入向量。主要特征如下:...
    packageimg
  • 文本语义向量嵌入数据集

    2025年10月13日 30 90 42

    文本语义向量嵌入数据集_Text_Semantic_Vector_Embeddings 数据来源:互联网公开数据 标签:文本嵌入, 语义向量, 向量数据库, 文本检索, 语义相似度, 机器学习, 自然语言处理, 知识图谱 数据概述: 该数据集包含基于Multi-QA-MPNet-Base-v1模型生成的文本语义向量嵌入。主要特征如下:...
    packageimg
  • 文本检索模型评估结果数据集

    2025年9月3日 30 13 12

    文本检索模型评估结果数据集_Text_Retrieval_Model_Evaluation_Results 数据来源:互联网公开数据 标签:文本检索, 信息检索, 模型评估, 语义相似度, 深度学习, 机器翻译, 知识图谱, 性能分析 数据概述:...
    packageimg
  • 越南语文本语义相似度数据集

    2025年8月30日 30 201 138

    越南语文本语义相似度数据集_Vietnamese_Text_Semantic_Similarity_Dataset 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 自然语言处理, 越南语, 文本数据, 机器学习, 语料库, 文本分析 数据概述: 该数据集包含来自越南语文本的多种类型数据,主要用于训练和评估语义相似度模型。主要特征如下:...
    packageimg
  • 文本语义向量数据集

    2025年8月30日 30 10 6

    文本语义向量数据集_Text_Semantic_Vector_Dataset 数据来源:互联网公开数据 标签:文本向量化, 语义相似度, 嵌入向量, 自然语言处理, 深度学习, 文本检索, 向量数据库, DistilBERT 数据概述: 该数据集包含经过DistilBERT模型处理生成的文本语义向量,记录了文本的语义特征。主要特征如下:...
    packageimg
  • 社交媒体用户文本语义相似度分析数据集

    2025年8月10日 30 109 84

    社交媒体用户文本语义相似度分析数据集_Social_Media_User_Text_Semantic_Similarity_Analysis 数据来源:互联网公开数据 标签:文本分析, 语义相似度, 词嵌入, 自然语言处理, 社交媒体, 数据挖掘, 机器学习, 向量空间模型 数据概述:...
    packageimg
  • 生物医学文本检索模型评估数据集

    2025年8月4日 30 30 7

    生物医学文本检索模型评估数据集_Biomedical_Text_Retrieval_Model_Evaluation_Dataset 数据来源:互联网公开数据 标签:生物医学, 文本检索, 模型评估, 预训练模型, 语义相似度, 零样本学习, PubMed, 深度学习 数据概述:...
    packageimg
  • 语义相似度模型训练评估结果数据集

    2025年7月28日 30 77 67

    语义相似度模型训练评估结果数据集_Semantic_Similarity_Model_Training_Evaluation_Results 数据来源:互联网公开数据 标签:语义相似度, 文本嵌入, 模型评估, 深度学习, 文本分析, 自然语言处理, 机器学习, STS-dev 数据概述:...
    packageimg
  • 知识点匹配文本二分类数据集

    2025年7月5日 30 88 80

    知识点匹配文本二分类数据集_Knowledge_Point_Matching_Text_Classification_Dataset 数据来源:互联网公开数据 标签:文本匹配,二分类,知识点,教育,机器学习,自然语言处理,语义相似度,文本分类 数据概述:...
    packageimg
  • 教育内容相关性文本对数据集EducationContentRelevanceTextPairs-syzong

    2025年5月31日 30 175 131

    教育内容相关性文本对数据集EducationContentRelevanceTextPairs-syzong 数据来源:互联网公开数据 标签:文本匹配, 教育, 内容相关性, 自然语言处理, 对比学习, 语义相似度, 机器学习, 知识点 数据概述: 该数据集包含来自教育领域的内容文本对,记录了知识点主题与学习内容之间的相关性。主要特征如下:...
    packageimg
  • 语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-himanshubag

    2025年5月31日 30 194 126

    语义相似度模型训练评估结果数据集SemanticSimilarityModelTrainingEvaluationResults-himanshubag 数据来源:互联网公开数据 标签:语义相似度, 模型评估, 文本嵌入, 深度学习, 句子转换器, 性能分析, 数据集, 机器学习 数据概述:...
    packageimg
  • 法律文本三元组知识抽取数据集LegalTextTripletKnowledgeExtractionDataset-minhlcnguyn

    2025年5月31日 30 200 38

    法律文本三元组知识抽取数据集LegalTextTripletKnowledgeExtractionDataset-minhlcnguyn 数据来源:互联网公开数据 标签:法律文本, 知识抽取, 三元组, 语义相似度, 自然语言处理, 文本匹配, 越南语, 数据挖掘 数据概述:...
    packageimg