SPECS_Based_语音风格关键词采集与背景噪声数据集

数据集概述

本数据集包含命令风格语音关键词(ck)、扩展命令风格语音关键词(eck)、对话风格语音(cs)三个子集及背景噪声文件夹,用于关键词识别和语音风格分析研究。所有语音为用户在安静环境下录制的16kHz 32位PCM WAV文件,背景噪声源自Google语音命令集。

文件详解

  • 主文件
  • 文件名称:SPECS.zip
  • 文件格式:ZIP
  • 内容说明:包含三个核心子集文件夹(命令关键词ck、扩展命令关键词eck、对话语音cs)及背景噪声文件夹;其中ck含10个关键词各10次命令风格录制,cs含20段含目标关键词的对话风格文本录制,eck为ck扩展音频边界并调整后的版本。
  • 音频文件(压缩包内)
  • 文件格式:WAV(16kHz 32位PCM)
  • 内容说明:ck为单关键词命令式录制,cs为含关键词的自然对话式文本录制,eck为ck的音频边界扩展版本。
  • 背景噪声文件(压缩包内)
  • 来源说明:复制自Google Speech Commands背景噪声集。

适用场景

  • 关键词识别研究:用于训练和测试命令式与对话式场景下的关键词检测模型。
  • 语音风格分析:对比命令风格与对话风格语音的声学特征差异。
  • 语音数据增强:利用背景噪声文件夹为语音识别模型添加噪声干扰训练。
  • 语音边界检测优化:基于eck子集研究关键词音频边界的扩展与调整方法。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 88.64 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。