阿拉伯自然语音情感数据集

阿拉伯自然语音情感数据集 数据来源:互联网公开数据
标签:阿拉伯语,语音情感识别,自然音频,情绪分类,统计特征,音频处理,机器学习

数据概述:
本数据集是首个阿拉伯自然语音情感数据集(ANAD),旨在识别三种离散情绪:快乐、愤怒和惊讶。数据集来源于8个阿拉伯脱口秀的在线视频,这些视频记录了主持人与现场外嘉宾的实时通话。每段视频被划分为说话者和倾听者的轮次,通过18名听众对每段音频进行情绪标注,最终去除沉默、笑声和噪声片段,形成包含1384条记录的最终语料库。

数据集提取了25个低层次描述特征(LLD),包括强度、过零率、梅尔频率倒谱系数(MFCC 1-12)、基频(F0)、基频包络、语音概率和线性预测码(LSP)频率等。每种特征应用了19种统计函数,如最大值、最小值、范围、均值、标准差、偏度、峰度等,并计算了每种LLD的Delta系数(一阶导数估计),总计生成950个特征。

数据用途概述:
该数据集适用于语音情感识别、语音处理研究、机器学习模型开发等多种场景。研究人员可利用此数据集训练情感分类模型,探索不同音频特征的有效性;开发者可基于数据集设计人机交互系统,提升语音助手的情绪识别能力;教育机构可将其用于语音处理和情感分析的教学与研究。此外,数据集还为验证不同特征提取方法和分类算法的性能提供了基准。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 14:50 (UTC)
创建于 五月 31, 2025, 14:49 (UTC)