数据集概述
本数据集包含已灭绝的东弗里斯兰语——Wangerooge弗里斯兰语的转录录音资料,总时长34分钟。录音于1924-1927年采集,涉及4位母语使用者,2024-25年完成转录,提供音频及对应的文本转录与英文翻译,是该濒危语言研究的重要资料。
文件详解
- 压缩包文件(Archive files)
- 文件名称:包括rec-br-conv.zip、rec-si-sailing.zip等13个.zip文件
- 文件格式:ZIP
- 内容说明:包含Wangerooge弗里斯兰语的原始音频录音及转录文件
- 元数据文件(Data files)
- 文件名称:metadata.csv
- 文件格式:CSV
- 字段映射:包含Filename(文件名)、Year(年份)、Location(地点)、Duration(时长)、Speaker(s)(说话人)、Linguist(语言学家)、Archive(档案馆)、Signature(档案编号)、Description(描述)等字段
- 说明文档(Document files)
- 文件名称:README.md
- 文件格式:MD
- 内容说明:数据集的详细说明,包括录音背景、转录信息及使用指引
数据来源
弗里斯兰电影与音频档案馆(Frisian Film & Audio Archive)
适用场景
- 濒危语言研究:用于分析Wangerooge弗里斯兰语的语音、语法及词汇特征
- 语言保护与复兴:为已灭绝语言的数字化存档和文化遗产保护提供原始资料
- 历史语言学分析:研究20世纪早期东弗里斯兰语方言的演变及消亡原因
- 人类学研究:通过语言录音探索当时Wangerooge地区的社会文化生活场景
- 翻译学研究:对比分析濒危语言转录文本与英文翻译的语言转换规律