找到5个数据集

格式: ZIP 标签: 语言资源开发

过滤结果
  • 加泰罗尼亚语语义文本相似度基准数据集1_0_2

    2025年12月9日 30 163 43

    数据集概述 该数据集是用于评估加泰罗尼亚语语义文本相似度(STS)的基准语料库,包含三千余对人工标注的句子对,标注遵循SemEval挑战指南,基于0到5分的相似度评分标准,为语义相似度模型的构建与评估提供支持。 文件详解 文件名称:STS-ca_v.1.0.2.zip 文件格式:ZIP压缩包...
    packageimg
  • 西班牙语方言词汇使用图数据集

    2025年12月8日 30 24 12

    数据集概述 该数据集包含西班牙语的方言词汇使用图(Word Usage Graphs, WUGs),记录了西班牙及古巴、哥伦比亚等西班牙语变体中词汇的使用差异。数据标注了词汇使用的方言分组与时间中点(约2000-2014年),并将噪声使用标注为聚类标签-1,为研究西班牙语词汇语义的方言变异提供支持。 文件详解 文件名称: diawug.zip...
    packageimg
  • 基于地区名称构建词汇语义场数据集

    2025年12月7日 30 60 2

    数据集概述 该数据集围绕基于地区名称构建词汇语义场的主题展开,包含一份相关的PDF文档,为研究词汇语义场的构建方法提供基础资料。 文件详解 文件名称:Sobirova Feruza Islomjon qizi.pdf 文件格式:PDF 内容说明:文档围绕“基于地区名称构建词汇语义场”的主题展开,具体内容需查阅文档获取 适用场景...
    packageimg
  • 乌兹别克语_英语药学术语词库的构建技术与语义领域

    2025年12月4日 30 196 9

    数据集概述 本数据集包含一份关于乌兹别克语-英语药学术语词库的研究文档,聚焦于词库的构建技术与语义领域划分,为药学领域双语术语资源的开发与应用提供参考。 文件详解 文件名称: Khudoyqulova Dlafruz Kabildjanovna.pdf 文件格式: PDF (.pdf) 文件内容: 文档围绕乌兹别克语-...
    packageimg
  • 德语词汇历时使用相关性判断数据集2021

    2025年12月4日 30 76 42

    数据集概述 该数据集包含针对德语词汇使用对的历时语义相关性判断数据,基于词汇语义变化标注框架构建,版本为3.0.0,更新于2021年12月15日,为研究词汇语义随时间的演变提供支持。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: durel.zip - 文件格式: ZIP压缩包 (.zip) - 内容说明:...
    packageimg