Papuan_Voices_Supplement_巴布亚岛屿语音录音媒体文件补充数据集

数据集概述

本数据集是Papuan Voices数据集的补充,包含巴布亚岛各地语音录音的媒体文件。数据以压缩包形式提供,内含按文件名首两位字符分类的音频文件夹,每个音频文件对应主数据集的ID,可辅助语音转录研究。

文件详解

  • README.md
  • 文件格式:MD
  • 字段映射介绍:包含数据集补充说明,提及媒体文件压缩包结构、音频文件命名规则及与主数据集ID的对应关系,还说明压缩包内包含index.csv文件(含local_pat...等附加列)
  • media.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内按文件名首两位字符创建子文件夹,每个音频文件以主数据集cldf/media.csv中的ID命名,内含index.csv文件(含local_pat...等附加列)

数据来源

https://papuanvoices.clld.org

适用场景

  • 语音语言学研究:用于分析巴布亚岛屿各地语音的发音特征、语言多样性
  • 语音转录辅助:为Papuan Voices主数据集的语音转录工作提供原始音频参考
  • 语言资源建设:补充巴布亚语言的语音语料库,支持濒危语言保护研究
  • 语音数据管理:学习多地区语音文件的分类存储与ID映射方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 372.29 MiB
最后更新 2026年1月14日
创建于 2026年1月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。