找到482个数据集

标签: 语音识别

过滤结果
  • YouTube音频说话人识别特征数据集-不同场景-64维-analystanand

    2025年4月22日   

    YouTube音频说话人识别特征数据集-不同场景-64维-analystanand 数据来源:互联网公开数据 标签:音频,说话人识别,YouTube,特征提取,机器学习,语音识别,音频分析,pyAudioAnalysis 数据概述:...
    packageimg
  • 航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei

    2025年4月21日   

    航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei 数据来源:互联网公开数据 标签:ATIS,SNIPS,语音识别,槽位标注,意图识别,自然语言处理,SLU,对话系统 数据概述:...
    packageimg
  • 电影对话语料库第一部分-1963至2021年-ilabyu

    2025年4月21日   

    电影对话语料库第一部分-1963至2021年-ilabyu 数据来源:互联网公开数据 标签:电影,对话,语料库,自然语言处理,语音识别,数据标注,深度学习 数据概述:...
    packageimg
  • LibriSpeech语音识别与活动检测标记数据集-8000Hz-30ms-100ms-max-micrag

    2025年4月21日   

    LibriSpeech语音识别与活动检测标记数据集-8000Hz-30ms-100ms-max-micrag 数据来源:互联网公开数据 标签:语音识别,活动检测,VAD,LibriSpeech,标记数据,音频处理,语音分析,机器学习 数据概述:...
    packageimg
  • 自由发音数字音频数据集

    2025年4月21日   

    自由发音数字音频数据集 数据来源:互联网公开数据 标签:语音识别,音频,数字,语音,机器学习,数据集,FSDD,开源 数据概述: 自由发音数字数据集(FSDD)是一个简单、开放的音频数据集,包含以8kHz采样率录制的英语数字语音wav文件。数据集中的录音经过剪辑,以最大限度地减少开头和结尾的静音。 数据集当前版本包括: 6位说话者...
    packageimg
  • 步态声音数据集

    2025年4月19日   

    步态声音数据集 数据来源:互联网公开数据 标签:步态声音, 语音识别, 生物识别, 人类行为分析, 声音信号处理, 健康监测, 男性, 女性 数据概述:...
    packageimg
  • 非洲尼日利亚口音语音数据集

    2025年4月18日   

    非洲尼日利亚口音语音数据集 数据来源:互联网公开数据 标签:尼日利亚,语音,口音,语言技术,语音识别,自然语言处理,语音合成 数据概述:...
    packageimg
  • 贝罗姆语音数据集

    2025年4月18日   

    贝罗姆语音数据集 数据来源:互联网公开数据 标签:贝罗姆语,语音数据,低资源语言,语音识别,语言研究,文本转语音 数据概述:...
    packageimg
  • 说话人口音识别数据集

    2025年4月15日   

    说话人口音识别数据集 数据来源:互联网公开数据 标签:语言学,机器学习,分类问题,语音识别,说话人识别,口音分析,数据集 数据概述:...
    packageimg
  • 特朗普演讲字幕数据集

    2025年4月15日   

    特朗普演讲字幕数据集 数据来源:互联网公开数据 标签:特朗普演讲,字幕,语音识别,文本分析,心理学,语言研究,自动字幕,YouTube 数据概述:...
    packageimg
  • 音频MNIST时序频谱特征语音识别特征数据集

    2025年4月15日   

    音频MNIST时序频谱特征语音识别特征数据集 数据来源:互联网公开数据 标签:音频特征,语音识别,时序特征,频谱特征,机器学习,深度学习,分类任务 数据概述:...
    packageimg
  • 通用语音数据集

    2025年4月15日   

    通用语音数据集 数据来源:互联网公开数据 标签:语音识别,模式识别,机器学习,特征提取,MFCC,年龄分类,语音处理 数据概述: 本数据集来源于Mozilla的通用语音项目,包含5000条葡萄牙语语音样本,用于年龄分类任务。每个音频样本提取了39个Mel-Frequency Cepstral Coefficients...
    packageimg
  • 语音识别WER结果数据集

    2025年4月15日   

    语音识别WER结果数据集 数据来源:互联网公开数据 标签:语音识别,WER,Whisper模型,古兰经数据集,增强前采样,结果分析,模型评估 数据概述: 本数据集包含使用Transformers...
    packageimg
  • 英国英语语音识别数据集1963-2021

    2025年4月15日   

    英国英语语音识别数据集1963-2021 数据来源:互联网公开数据 标签:英国英语,语音识别,自然语言处理,对话系统,语言理解,音频数据,文本转录,演讲者信息,多样话题 数据概述:...
    packageimg
  • 音素数据集

    2025年4月15日   

    音素数据集 数据来源:互联网公开数据 标签:音素,语音识别,分类,机器学习,自适应学习,人工神经网络,语音处理 数据概述:...
    packageimg
  • 十人语音数据集

    2025年4月14日   

    十人语音数据集 数据来源:互联网公开数据 标签:语音识别,机器学习,信号处理,语音数据,音频分析,人声识别,语音特征 数据概述: 本数据集包含十位不同人员的语音样本,用于语音识别和信号处理的研究。数据集涵盖了多种语音特征,适用于机器学习算法的训练和测试,为开发高效的语音识别系统提供了基础数据支持。 数据用途概述:...
    packageimg
  • 韩国男性元音语音数据集

    2025年4月14日   

    韩国男性元音语音数据集 数据来源:互联网公开数据 标签:语音数据,韩语元音,声学特征,语音信号处理,语音识别,声学分析,语音质量评估 数据概述: 本数据集包含一位30岁韩国男性(非专业配音演员)的元音语音记录,采用WAV格式,采样率为48kHz,16位深度。语音录制使用CM7010 USB麦克风完成,经过GoldWave...
    packageimg
  • 语音元音类别不平衡分类数据集

    2025年4月14日   

    语音元音类别不平衡分类数据集 数据来源:互联网公开数据 标签:语音识别,语音元音,类别不平衡,谐波分析,特征提取,分类算法,机器学习 数据概述: 本数据集来自欧洲ESPRIT 5516项目“ROARS”,旨在开发和实现法语和西班牙语的实时语音识别分析系统。数据集包含来自1809个孤立音节的元音样本(例如:pa, ta,...
    packageimg
  • 语音克隆及音调添加音频与音高数据集1963-2021

    2025年4月14日   

    语音克隆及音调添加音频与音高数据集1963-2021 数据来源:互联网公开数据 标签:语音克隆,音调添加,音频分析,音高数据,语音识别,音频分类,音高检测 数据概述:...
    packageimg
  • YouTube视频转录文本数据分析数据集

    2025年4月14日   

    YouTube视频转录文本数据分析数据集 数据来源:互联网公开数据 标签:YouTube,视频,转录文本,语音识别,文本分析,自然语言处理,内容创作,社交媒体 数据概述:...
    packageimg