Pyu_Based骠铭文语料库XML数据20180326

数据集概述

本数据集为骠铭文语料库的XML压缩文件,包含由Arlo Griffiths、Marc Miyake和Julian K. Wheatley完成的骠铭文转写内容,语料库通过指定网址持续更新。每个XML文件对应一份骠铭文,转写中用C表示未知辅音、V表示未知元音,为骠铭文研究提供结构化文本资源。

文件详解

  • 文件名称:Corpus of Pyu inscriptions 180326.zip
  • 文件格式:ZIP(压缩包)
  • 字段映射介绍:压缩包内包含多个XML文件,每个XML对应一份骠铭文的转写内容;转写文本中含标识未知辅音的"C"和未知元音的"V"标记,具体字段结构需解压后查看XML文件内容。

数据来源

http://hisoma-huma-num.fr/exist/apps/pyu/index2.html

适用场景

  • 骠铭文语言学研究:分析骠铭文的文字结构、语音系统及词汇特征。
  • 古代文字转写规范验证:参考专业学者的转写成果,完善古代文字转写标准。
  • 历史文化研究:通过骠铭文内容探究骠国的历史、社会与文化信息。
  • 语料库语言学应用:构建骠铭文文本语料库,支持自然语言处理相关实验。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.58 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。