数据集概述
本数据集为“2019年科隆城市田野调查”项目成果,包含圣维森特岛佛得角克里奥尔语的语言录音、文本转录及社会语言学分析资料,涵盖原始音频、标注文件、参与者信息与研究说明,为克里奥尔语研究提供多类型数据支持。
文件详解
该数据集包含11个文件,按类型分类说明如下:
- PDF文档类(共4个):
- KEA_2019_Projektinformationsblatt.pdf:项目信息说明文档
- KEA_2019_Teilnehmerindaten.pdf:参与者信息文档
- KEA_2019_Soziolinguistische Beschreibung.pdf:社会语言学描述文档
- KEA_2019_Einverstaendniserklaerung.pdf:知情同意书文档
- 文本文件类(共3个):
- KEA_2019_Allgm. Daten zum Projekt.txt:项目综合数据文本
- KEA_2019_Swadesh.txt:斯瓦迪士核心词表文本
- KEA_2019_Text.txt:语言文本转录文件
- 音频文件类(共2个):
- KEA_2019_Swadesh.wav:斯瓦迪士词表音频录音
- KEA_2019_Text.wav:语言文本音频录音
- 标注文件类(共2个):
- KEA_2019_Swadesh.eaf:斯瓦迪士词表音频标注文件(ELAN格式)
- KEA_2019_Text.eaf:语言文本音频标注文件(ELAN格式)
适用场景
- 语言学研究:分析圣维森特岛佛得角克里奥尔语的语音特征与词汇系统
- 社会语言学研究:探究科隆地区佛得角克里奥尔语使用者的语言使用现状
- 濒危语言保护:为佛得角克里奥尔语的语料保存与传承提供基础数据
- 语音技术开发:支持克里奥尔语语音识别、语音合成等自然语言处理任务