kadazan_digits_Based_卡达山语数字语音数据集

数据集概述

本数据集包含50位说话者用卡达山语录制的10个口语数字的语音数据,数字为‘Iso'(1)、'Duvo'(2)、'Tohu'(3)、'Apat'(4)、'Himo'(5)、'Onom'(6)、'Tuu'(7)、'Vahu'(8)、'Sizam'(9)、'Opod’(10)。样本由不同质量麦克风在嘈杂环境下录制,文件名末位数字表示对应数字序号(如0对应‘Iso'),其余数字代表说话者。

文件详解

  • 压缩文件
  • 文件名称:mohammadalihumayun/kadazan_digits-v2.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含卡达山语数字语音数据,文件名末位数字对应数字序号(0对应‘Iso',依此类推),其余数字代表说话者。

数据来源

mohammadalihumayun/kadazan_digits

适用场景

  • 语音识别模型训练: 用于训练卡达山语数字语音识别模型。
  • 低资源语言语音研究: 研究卡达山语语音特征及识别方法。
  • 噪声环境语音处理: 分析不同质量麦克风和嘈杂环境对语音识别的影响。
  • 多说话者语音数据应用: 用于多说话者语音识别模型的训练和评估。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 36.62 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。