-
YouTube音频说话人识别特征数据集-不同场景-64维-analystanand
YouTube音频说话人识别特征数据集-不同场景-64维-analystanand 数据来源:互联网公开数据 标签:音频,说话人识别,YouTube,特征提取,机器学习,语音识别,音频分析,pyAudioAnalysis 数据概述:... -
航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei
航空公司陆行信息系统与个人语音助手意图识别数据集2011-2018-weipengfei 数据来源:互联网公开数据 标签:ATIS,SNIPS,语音识别,槽位标注,意图识别,自然语言处理,SLU,对话系统 数据概述:... -
电影对话语料库第一部分-1963至2021年-ilabyu
电影对话语料库第一部分-1963至2021年-ilabyu 数据来源:互联网公开数据 标签:电影,对话,语料库,自然语言处理,语音识别,数据标注,深度学习 数据概述:... -
LibriSpeech语音识别与活动检测标记数据集-8000Hz-30ms-100ms-max-micrag
LibriSpeech语音识别与活动检测标记数据集-8000Hz-30ms-100ms-max-micrag 数据来源:互联网公开数据 标签:语音识别,活动检测,VAD,LibriSpeech,标记数据,音频处理,语音分析,机器学习 数据概述:... -
自由发音数字音频数据集
自由发音数字音频数据集 数据来源:互联网公开数据 标签:语音识别,音频,数字,语音,机器学习,数据集,FSDD,开源 数据概述: 自由发音数字数据集(FSDD)是一个简单、开放的音频数据集,包含以8kHz采样率录制的英语数字语音wav文件。数据集中的录音经过剪辑,以最大限度地减少开头和结尾的静音。 数据集当前版本包括: 6位说话者... -
-
-
-
-
-
音频MNIST时序频谱特征语音识别特征数据集
音频MNIST时序频谱特征语音识别特征数据集 数据来源:互联网公开数据 标签:音频特征,语音识别,时序特征,频谱特征,机器学习,深度学习,分类任务 数据概述:... -
通用语音数据集
通用语音数据集 数据来源:互联网公开数据 标签:语音识别,模式识别,机器学习,特征提取,MFCC,年龄分类,语音处理 数据概述: 本数据集来源于Mozilla的通用语音项目,包含5000条葡萄牙语语音样本,用于年龄分类任务。每个音频样本提取了39个Mel-Frequency Cepstral Coefficients... -
语音识别WER结果数据集
语音识别WER结果数据集 数据来源:互联网公开数据 标签:语音识别,WER,Whisper模型,古兰经数据集,增强前采样,结果分析,模型评估 数据概述: 本数据集包含使用Transformers... -
英国英语语音识别数据集1963-2021
英国英语语音识别数据集1963-2021 数据来源:互联网公开数据 标签:英国英语,语音识别,自然语言处理,对话系统,语言理解,音频数据,文本转录,演讲者信息,多样话题 数据概述:... -
-
十人语音数据集
十人语音数据集 数据来源:互联网公开数据 标签:语音识别,机器学习,信号处理,语音数据,音频分析,人声识别,语音特征 数据概述: 本数据集包含十位不同人员的语音样本,用于语音识别和信号处理的研究。数据集涵盖了多种语音特征,适用于机器学习算法的训练和测试,为开发高效的语音识别系统提供了基础数据支持。 数据用途概述:... -
韩国男性元音语音数据集
韩国男性元音语音数据集 数据来源:互联网公开数据 标签:语音数据,韩语元音,声学特征,语音信号处理,语音识别,声学分析,语音质量评估 数据概述: 本数据集包含一位30岁韩国男性(非专业配音演员)的元音语音记录,采用WAV格式,采样率为48kHz,16位深度。语音录制使用CM7010 USB麦克风完成,经过GoldWave... -
语音元音类别不平衡分类数据集
语音元音类别不平衡分类数据集 数据来源:互联网公开数据 标签:语音识别,语音元音,类别不平衡,谐波分析,特征提取,分类算法,机器学习 数据概述: 本数据集来自欧洲ESPRIT 5516项目“ROARS”,旨在开发和实现法语和西班牙语的实时语音识别分析系统。数据集包含来自1809个孤立音节的元音样本(例如:pa, ta,... -
语音克隆及音调添加音频与音高数据集1963-2021
语音克隆及音调添加音频与音高数据集1963-2021 数据来源:互联网公开数据 标签:语音克隆,音调添加,音频分析,音高数据,语音识别,音频分类,音高检测 数据概述:... -
YouTube视频转录文本数据分析数据集
YouTube视频转录文本数据分析数据集 数据来源:互联网公开数据 标签:YouTube,视频,转录文本,语音识别,文本分析,自然语言处理,内容创作,社交媒体 数据概述:...