找到1个数据集

标签: EFA 227_16 LINGUATEC Project

过滤结果
  • Tolosa_Treebank_Occitan语言依存句法标注数据

    2026年1月27日 30 174 96

    数据集概述 本数据集是首个奥克语依存树库,由POCTEFA Interreg欧洲基金资助的EFA 227/16 LINGUATEC项目开发。包含25K个标注了词性标签、词元及句法依存关系的词元,遵循通用依存关系(UD)标注规范,数据以ConLL-U格式存储,覆盖加斯科涅、朗格多克、勒穆瓦纳和普罗旺斯四种主要奥克语方言。 文件详解...
    packageimg