找到2个数据集

标签: 分词标注

过滤结果
  • CONTRAST_IT_Based_西班牙语报纸文章语料库数据

    2026年1月28日 0 90 32

    数据集概述 本数据集是CONTRAST-IT多语言语料库的西班牙语部分,包含2011-2012年来自西班牙《国家报》(elpais.com)和《世界报》(elmundo.es)的476篇完整新闻文章,总字数约30万字,文本具有当代西班牙语报纸语言代表性,用于构建对比语言学研究用的语料库。 文件详解 文件组:CONTRAST-IT西班牙语新闻文章集...
    packageimg
  • SPACCC_TOKEN_Based_西班牙语临床病例语料库分词标注第一版数据

    2026年1月19日 30 15 5

    数据集概述 本数据集为西班牙语临床病例语料库(SPACCC)的第一版分词标注数据,由基于FreeLing3.1的西班牙语临床病例语料库词性标注器(SPACCC_POS-TAGGER)生成,包含对临床文本的分词标注内容,适用于医学NLP领域的文本处理研究。 文件详解 文件名称:SPACCC_TOKEN.zip 文件格式:ZIP...
    packageimg