藏文古典语料库词性标注数据集

数据集概述

该数据集是对藏文古典文本进行词性标注的语料库,包含9世纪藏文经典文献、13世纪佛教史文献及15世纪传记类文本,为藏文自然语言处理研究提供基础标注数据。

文件详解

  • 文件名称: Texts.zip
  • 文件格式: ZIP压缩包
  • 文件内容: 包含Mdzaṅs blun(9世纪,经典文献)、Bu ston chos ḥbyuṅ(13世纪,佛教史)、Mi la ras paḥi rnam thar和Mar paḥi rnam thar(15世纪,传记)等藏文古典文本的词性标注数据,具体字段需解压后查看

数据来源

伦敦大学亚非学院(SOAS)

适用场景

  • 藏文自然语言处理研究: 用于训练和评估藏文词性标注模型
  • 藏文语言学研究: 分析藏文古典文本的语法结构和词汇特征
  • 藏文文献数字化: 为藏文古典文献的数字化处理提供标注参考
  • 民族语言资源建设: 补充藏文语言资源库,支持多语言NLP技术发展
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.7 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。