数据集概述
该数据集为2018年柏林洪堡大学"城市田野调查"研讨会产出的达扎加语(撒哈拉中部语言)研究资料,包含斯瓦迪士词汇表录音、分裂不及物性现象诱发实验录音,以及对应的转录、标注文件与元数据,由达扎加母语者协助完成。
文件详解
该数据集包含22个文件,具体说明如下:
- 音频文件(.wav格式):
- Swadesh-Liste 1-26.wav、Swadesh-Liste 27-53.wav、Swadesh-Liste 54-80.wav、Swadesh-Liste 81-100.wav:达扎加语斯瓦迪士词汇表录音文件
- 其他相关录音文件(未完整列出)
- 转录标注文件:
- .eaf格式文件(如Swadesh.Transkr.Dazaga_1-26.eaf):达扎加语转录标注文件
- .pfsx格式文件(如Swadesh.Transkr.Dazaga_1-26.pfsx):达扎加语转录标注文件
- 文档与元数据文件:
- Infoblatt_Einverständniserkl_Teilnehmerbogen.pdf:知情同意书与参与者表格
- DAZAGA in Berlin-Brandenburg_Tsokanos.pdf:项目研究论文
- Sessioninfos_1_Metadaten.txt、Sessioninfos_2_Metadaten.txt等:元数据文本文件
- 其他扫描文档(如gescannte Swadeshliste_Dazaga.pdf)
数据来源
柏林洪堡大学(Humboldt-Universität zu Berlin)
适用场景
- 语言学研究:用于达扎加语语音、语法(如分裂不及物性)特征分析
- 语言资源建设:为达扎加语词汇库、语音语料库构建提供基础数据
- 田野语言学教学:作为城市田野调查方法的实践案例参考
- 濒危语言保护:支持达扎加语(撒哈拉中部语言)的记录与保存工作