数据集概述
本数据集包含八部克木语(Kmhmu')文本,采用逐行对照格式呈现,包含国际音标(IPA)转写、英文注释及自由翻译,为克木语语言研究提供结构化语料。
文件详解
该数据集由八个PDF格式的文档文件组成,具体如下:
- 文件名称及格式:
- Tan Srma' - Interlinear 200125.pdf:PDF格式,克木语文本逐行对照文件
- Hual - interlinear 210125.pdf:PDF格式,克木语文本逐行对照文件
- Koon ñè' ngo' yoh hian - interlinear 210125.pdf:PDF格式,克木语文本逐行对照文件
- Mar giang - interlinear 210125.pdf:PDF格式,克木语文本逐行对照文件
- Côôn Baar Gôn - interlinear 200125.pdf:PDF格式,克木语文本逐行对照文件
- Ya' Man Jo - interlinear 200125.pdf:PDF格式,克木语文本逐行对照文件
- Rvaay mah gôn - interlinear 200125.pdf:PDF格式,克木语文本逐行对照文件
- Yông Haan yoor Hnta' So' - interlinear 200125.pdf:PDF格式,克木语文本逐行对照文件
- 文件内容结构:每个PDF文件均包含克木语原文、国际音标转写、英文词汇注释及英文自由翻译的逐行对照内容。
适用场景
- 语言学研究:用于克木语语音、语法、词汇系统的描述性分析与比较研究
- 少数民族语言保护:为克木语的文献整理、语言传承提供原始语料支持
- 翻译学研究:分析克木语与英语的语义对应关系及翻译策略
- 语言教学资源:可作为克木语学习者的阅读材料及语言习得研究数据