可变强度情感与情绪发声语料库VIVAE

数据集概述

该数据集包含人类非言语情感发声录音,分为全量集(一千零八十五个音频文件)和核心集(四百八十个音频文件)。全量集涵盖十一位说话者表达的六种情感(三种积极、三种消极),每种情感包含从低到峰值的强度变化;核心集为基于真实性判断筛选的交叉子样本,为情感发声研究提供标准化数据支持。

文件详解

  • 压缩包文件:
  • VIVAE.zip: ZIP格式压缩包,包含所有音频文件
  • 音频文件格式: WAV,采样率四万四千一百赫兹,十六位分辨率
  • 音频文件命名规则: [Speaker_Emotion_Intensity_Item-ID.wav],包含四个维度信息:
  • Speaker: 说话者编号(S01至S11)
  • Emotion: 情感类型(achievement、anger、fear、pain、pleasure、surprise)
  • Emotional intensity: 情绪强度(low、moderate、strong、peak)
  • Item-ID: 项目唯一标识符
  • 文件夹结构:
  • Full set: 存放全量一千零八十五个音频文件
  • Core set: 存放筛选后的四百八十个音频文件

适用场景

  • 情感计算研究: 分析非言语情感发声的声学特征与情绪强度的关联
  • 心理学实验: 用于情绪感知实验,探究人类对不同强度情感发声的识别能力
  • 语音技术开发: 为情感语音合成、情绪识别模型训练提供标注数据
  • 跨文化情感研究: 对比不同文化背景下情感发声的共性与差异
  • 临床心理学应用: 辅助情绪障碍患者的情感表达评估与干预研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 89.13 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。