找到2个数据集

分类: 公开数据 标签: SOAS

过滤结果
  • 藏文古典语料库词性标注数据集

    2025年12月22日 30 15 12

    数据集概述 该数据集是对藏文古典文本进行词性标注的语料库,包含9世纪藏文经典文献、13世纪佛教史文献及15世纪传记类文本,为藏文自然语言处理研究提供基础标注数据。 文件详解 文件名称: Texts.zip 文件格式: ZIP压缩包 文件内容: 包含Mdzaṅs blun(9世纪,经典文献)、Bu ston chos ḥbyuṅ(13世纪,佛教史)、Mi...
    packageimg
  • 藏语古典词性标注词汇表

    2025年12月4日 30 43 37

    数据集概述 该数据集是为自然语言处理(NLP)任务构建的藏语古典词性标注词汇表。数据来源于动词词干数字化版本及人工标注的训练数据,部分词汇通过手动添加以优化基于规则的词性标注,适用于藏语古典文本的词性分析与处理。 文件详解 文件名称: Lexicons.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg