杜洪比语个人叙事转录解析与翻译文本数据集

数据集概述

该数据集包含杜洪比语个人叙事的音频文件及配套文本文件,覆盖死亡故事、村庄历史、狩猎、饮酒、驱邪等主题,提供转录、解析、标注及翻译内容,对应《杜洪比语语法》中的文本材料。

文件详解

  • 音频文件(.wav格式):包含5个CHUK编号开头的音频文件,对应各叙事主题的原始录音
  • 转录文件(.trs格式):5个CHUK编号开头的Transcriber转录文件,与音频内容对应
  • 文本文件(.txt格式):5个CHUK编号开头的Toolbox兼容文本文件,包含ELAN标注信息、发音人、音频链接等字段
  • PDF文件(.pdf格式):5个CHUK编号开头的文档,提供完整转录、标注、解析及翻译内容
  • 设置文件(Settings.zip):包含杜洪比语IPA键盘、Toolbox数据库设置、杜洪比语词典及解析词典

数据来源

Timotheus Adrianus Bodt《Grammar of Duhumbi》(Leiden: Brill, 2020)

适用场景

  • 语言学研究:杜洪比语语法特征分析、语音系统研究
  • 民族志研究:杜洪比语使用者的文化叙事与社会生活分析
  • 语言教学:杜洪比语语言学习与文献阅读
  • 计算语言学:低资源语言处理模型训练、语音文本对齐研究
  • 文化遗产保护:濒危语言口头传统数字化保存与分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 159.42 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。