阿拉伯语语音命令数据集

数据集概述

该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。

文件详解

  • 主数据压缩包:
  • 文件名称: abdulkaderghandoura/arabic-speech-commands-dataset-v1.0.zip
  • 文件格式: ZIP (.zip)
  • 内部结构: 包含40个关键词文件夹(每个含300条音频)、background_noise背景噪声文件夹及数据划分CSV文件
  • 音频文件命名规则: 前8位为参与者ID,后2位为录制轮次,示例:rotate/00000021_NO_06.wav

适用场景

  • 语音识别研究: 用于训练和评估阿拉伯语关键词检测(KWS)模型
  • 机器学习教育: 作为语音信号处理与小模型训练的教学数据集
  • 噪声鲁棒性分析: 结合背景噪声数据研究语音识别系统的抗干扰能力
  • 模型基准测试: 基于标准数据划分(60%训练/20%验证/20%测试)进行模型性能对比
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 331.17 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。