数据集

通用语音数据集

通用语音数据集数据来源：互联网公开数据标签：语音识别,模式识别,机器学习,特征提取,MFCC,年龄分类,语音处理数据概述：本数据集来源于Mozilla的通用语音项目，包含5000条葡萄牙语语音样本，用于年龄分类任务。每个音频样本提取了39个Mel-Frequency Cepstral Coefficients (MFCC)特征，这些特征捕捉了语音信号的频谱特性，转换为MEL频率刻度以更好地模拟人类听觉系统。数据用途概述：该数据集适用于语音识别、模式识别和机器学习领域的教育和研究。具体而言，数据集可用于训练分类模型，以识别不同年龄段的说话人，年龄分类为五个类别：青少年、二十几岁、三十几岁、四十几岁和五十几岁。此外，数据集适合用于教学实验，帮助学生掌握特征提取和语音分类的知识和技能。举例：文件名为treino.csv，包含3500个训练样本及其对应的39个MFCC特征。第1列是样本标识，第41列是样本对应的年龄类别标签，用于模型训练。

数据与资源

通用语音数据集.zipZIP
1.75 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.75 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

通用语音数据集

数据与资源

附加信息

注册成功！