找到2个数据集

标签: 跨语言模型对比

过滤结果
  • Tigrinya_Analogy_Test_词嵌入模型评估数据集

    2026年2月13日 30 141 78

    数据集概述 本数据集是提格利尼亚语版的谷歌类比测试集,用于评估词嵌入模型质量。数据经机器翻译后由母语者人工验证,剔除了不适用的条目,最终包含一万八千四百六十五条语义和句法类比条目,分为首都、货币、家庭、时态等九个测试小节。 文件详解 文件名称:TigrinyaAnalogyTest.zip 文件格式:ZIP...
    packageimg
  • 用于流行病学事件提取的多语言数据集_LREC_2020

    2026年1月30日 30 202 64

    数据集概述 本数据集是LREC 2020论文《A Dataset for Multi-lingual Epidemiological Event Extraction》配套数据,包含多语言流行病学事件抽取语料,支持自然语言处理领域相关研究,以压缩包形式提供,仅含一个文件。 文件详解...
    packageimg