Wangerooge_Frisian_Based_已灭绝东弗里斯兰语录音转录数据集

数据集概述

本数据集包含已灭绝的东弗里斯兰语——Wangerooge弗里斯兰语的转录录音资料,总时长34分钟。录音于1924-1927年采集,涉及4位母语使用者,2024-25年完成转录,提供音频及对应的文本转录与英文翻译,是该濒危语言研究的重要资料。

文件详解

  • 压缩包文件(Archive files)
  • 文件名称:包括rec-br-conv.zip、rec-si-sailing.zip等13个.zip文件
  • 文件格式:ZIP
  • 内容说明:包含Wangerooge弗里斯兰语的原始音频录音及转录文件
  • 元数据文件(Data files)
  • 文件名称:metadata.csv
  • 文件格式:CSV
  • 字段映射:包含Filename(文件名)、Year(年份)、Location(地点)、Duration(时长)、Speaker(s)(说话人)、Linguist(语言学家)、Archive(档案馆)、Signature(档案编号)、Description(描述)等字段
  • 说明文档(Document files)
  • 文件名称:README.md
  • 文件格式:MD
  • 内容说明:数据集的详细说明,包括录音背景、转录信息及使用指引

数据来源

弗里斯兰电影与音频档案馆(Frisian Film & Audio Archive)

适用场景

  • 濒危语言研究:用于分析Wangerooge弗里斯兰语的语音、语法及词汇特征
  • 语言保护与复兴:为已灭绝语言的数字化存档和文化遗产保护提供原始资料
  • 历史语言学分析:研究20世纪早期东弗里斯兰语方言的演变及消亡原因
  • 人类学研究:通过语言录音探索当时Wangerooge地区的社会文化生活场景
  • 翻译学研究:对比分析濒危语言转录文本与英文翻译的语言转换规律
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 219.83 MiB
最后更新 2026年1月15日
创建于 2026年1月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。