找到1个数据集

标签: 一亿八千五百万词元

过滤结果
  • 古典藏文标注语料库2020_Version2_带分词与词性标注

    2025年12月7日 30 166 44

    数据集概述 该数据集为古典藏文标注语料库(ACTib)第二版,包含超一亿八千五百万个词元,基于XML文件构建,提供分词与词性标注的压缩文件,采用自动后处理方法,未涉及人工校正。 文件详解 数据集包含11个压缩文件,具体说明如下: - 压缩文件组(共11个.zip格式文件): - SegPOS-...
    packageimg