数据集

阿拉伯自然语音情感数据集

阿拉伯自然语音情感数据集数据来源：互联网公开数据
标签：阿拉伯语,语音情感识别,自然音频,情绪分类,统计特征,音频处理,机器学习

数据概述：
本数据集是首个阿拉伯自然语音情感数据集（ANAD），旨在识别三种离散情绪：快乐、愤怒和惊讶。数据集来源于8个阿拉伯脱口秀的在线视频，这些视频记录了主持人与现场外嘉宾的实时通话。每段视频被划分为说话者和倾听者的轮次，通过18名听众对每段音频进行情绪标注，最终去除沉默、笑声和噪声片段，形成包含1384条记录的最终语料库。

数据集提取了25个低层次描述特征（LLD），包括强度、过零率、梅尔频率倒谱系数（MFCC 1-12）、基频（F0）、基频包络、语音概率和线性预测码（LSP）频率等。每种特征应用了19种统计函数，如最大值、最小值、范围、均值、标准差、偏度、峰度等，并计算了每种LLD的Delta系数（一阶导数估计），总计生成950个特征。

数据用途概述：
该数据集适用于语音情感识别、语音处理研究、机器学习模型开发等多种场景。研究人员可利用此数据集训练情感分类模型，探索不同音频特征的有效性；开发者可基于数据集设计人机交互系统，提升语音助手的情绪识别能力；教育机构可将其用于语音处理和情感分析的教学与研究。此外，数据集还为验证不同特征提取方法和分类算法的性能提供了基准。

数据与资源

阿拉伯自然语音情感数据集.zipZIP
536.80 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	536.8 MiB
最后更新	2025年5月31日
创建于	2025年5月31日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

阿拉伯自然语音情感数据集

数据与资源

附加信息

注册成功！