帕皮阿门托语医疗环境关键词识别语音转文本数据集

数据集概述

本数据集为帕皮阿门托语医疗环境下的关键词识别语音转文本研究开发,包含七个类别(六个关键词和一个未知类别)的语音样本,经过滤后共16766个样本,每个样本为一秒钟录音生成的频谱图,用于推动帕皮阿门托语关键词识别研究。

文件详解

  • 文件名称:papiamento_keyword_spotting_dataset.zip
  • 文件格式:ZIP(.zip)
  • 内容说明:压缩包内包含所有数据集文件,样本以.npz格式存储,每个样本为124频率 bin×129时间帧的频谱图,标签分为Dolor(疼痛)、Masha danki(非常感谢)、No(不)、Resultado(结果)、SSIMSAN(唤醒词)、Unknown(未知类别)共七类

适用场景

  • 帕皮阿门托语语音识别模型训练与优化
  • 医疗环境下关键词识别技术研究
  • 低资源语言语音转文本技术探索
  • 多语言语音交互系统开发
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 950.04 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。