通用语音数据集

通用语音数据集 数据来源:互联网公开数据 标签:语音识别,模式识别,机器学习,特征提取,MFCC,年龄分类,语音处理 数据概述: 本数据集来源于Mozilla的通用语音项目,包含5000条葡萄牙语语音样本,用于年龄分类任务。每个音频样本提取了39个Mel-Frequency Cepstral Coefficients (MFCC)特征,这些特征捕捉了语音信号的频谱特性,转换为MEL频率刻度以更好地模拟人类听觉系统。 数据用途概述: 该数据集适用于语音识别、模式识别和机器学习领域的教育和研究。具体而言,数据集可用于训练分类模型,以识别不同年龄段的说话人,年龄分类为五个类别:青少年、二十几岁、三十几岁、四十几岁和五十几岁。此外,数据集适合用于教学实验,帮助学生掌握特征提取和语音分类的知识和技能。 举例: 文件名为treino.csv,包含3500个训练样本及其对应的39个MFCC特征。第1列是样本标识,第41列是样本对应的年龄类别标签,用于模型训练。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 15, 2025, 09:21 (UTC)
创建于 四月 15, 2025, 09:21 (UTC)