找到4个数据集

标签: 奥克语

过滤结果
  • OWT_Tag_Based_奥克语传统书面民间故事词性标注语料库

    2026年1月28日 30 54 6

    数据集概述 本数据集包含5篇奥克语传统书面民间故事文本摘录,均按照Grace标准进行了词元与词性的人工标注。文本摘录自J.-F. Bladé、J.-V. Lalanne等作者的民间故事集,每篇约1500词,用于评估奥克语词性标注工具Talismane针对OcOr语料库的性能,由ExpressioNarration项目产出。 文件详解 文件名称:OWT-...
    packageimg
  • Tolosa_Treebank_Occitan语言依存句法标注数据

    2026年1月27日 30 206 58

    数据集概述 本数据集是首个奥克语依存树库,由POCTEFA Interreg欧洲基金资助的EFA 227/16 LINGUATEC项目开发。包含25K个标注了词性标签、词元及句法依存关系的词元,遵循通用依存关系(UD)标注规范,数据以ConLL-U格式存储,覆盖加斯科涅、朗格多克、勒穆瓦纳和普罗旺斯四种主要奥克语方言。 文件详解...
    packageimg
  • 奥克语标注语料库

    2025年12月21日 30 81 30

    数据集概述 该数据集为奥克语标注语料库,包含经人工标注词性和词元的奥克语文本,共28篇文档、12425个词元,标注流程详见指定学术文章,为奥克语自然语言处理研究提供基础数据。 文件详解 文件名称: CorpusRestaureOccitan.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含采用TSV CoNLL-...
    packageimg
  • 奥克语口头叙事语料库_OcOr

    2025年12月4日 30 78 54

    数据集概述 该数据集是奥克语口头叙事语料库(OcOr),包含三个子语料库:传统口头叙事(OOT)、传统书面叙事(OWT)、当代口头叙事(OOC),标注了时态、连接词等时间特征,以XML和PDF格式存储,支持语言与口头性关系的研究。 文件详解 语料库压缩文件:...
    packageimg