-
情感语音识别数据集
2026年2月21日 0 160 9
情感语音识别数据集_Emotion_Speech_Recognition_Dataset 数据来源:互联网公开数据 标签:语音识别,情感分析,音频数据,情感分类,深度学习,语音信号处理,机器学习,情感语音 数据概述: 该数据集包含来自互联网的音频数据,记录了不同情感状态下的语音样本。主要特征如下:...
-
STDR_Based单麦克风降噪算法数据
2026年2月9日 30 208 109
数据集概述 本数据集为STDR单麦克风降噪算法相关数据,STDR算法基于人工神经网络检测、提取和重建语音中的频谱-时间特征,可在保留前景语音质量的同时降低背景噪声,提升语音可懂度,适用于助听器、自动语音识别等实时场景。数据集含1个文件。 文件详解 文件名称:data_csv_files.zip 文件格式:ZIP...
-
VNLL_Based大鼠听觉脑干宽带抑制神经机制实验数据
2026年1月30日 30 149 32
数据集概述 本数据集包含大鼠外侧丘系腹侧核(VNLL)细胞在听觉刺激下的在体胞内响应实验数据,用于构建并验证整合了快速抑制机制的泄漏整合发放(LIF)神经元模型,探究VNLL细胞对类语音刺激的响应及宽带起始抑制对频谱飞溅的抑制作用。数据集仅包含一个压缩文件。 文件详解 文件名称:celldata.zip 文件格式:ZIP(压缩包)...
-
Prosodic_Based_词切分任务韵律边界线索逆相关研究数据
2026年1月27日 30 11 8
数据集概述 本数据集包含韵律逆相关研究中使用的刺激材料、原始数据和后处理数据,研究主题为词切分任务中的词边界韵律线索。实验采用单区间试次设计,目标词结构为l'aX和la'X,共47名参与者分5种条件参与,实验通过fastACI工具箱实现,数据集含4个文件。 文件详解 刺激材料文件: 文件名称:01-Stimuli.zip 文件格式:ZIP...
-
Sheffield_Based_听觉处理与组织建模_语音和噪声混合数据集
2026年1月22日 30 203 119
数据集概述 本数据集包含用于《听觉处理与组织建模》研究的语音和噪声混合信号,源自谢菲尔德大学计算机科学系的博士论文。数据集以压缩包形式提供,核心内容为支持听觉处理建模研究的语音与噪声信号资源,总计包含一个文件。 文件详解 文件名称:cookePhD.zip 文件格式:ZIP...
-
Speech_Intelligibility_Based_频谱退化句子语音清晰度实验原始数据
2026年1月12日 30 179 62
数据集概述 本数据集记录了频谱退化句子的语音清晰度实验数据,旨在探究振幅与相位信息对语音清晰度的差异化贡献。实验中听者需在听取频谱退化的句子后完成单词识别任务,刺激通过分割句子、独立解相关各片段的振幅与相位成分生成,包含三种片段长度:30毫秒(音素长度)、250毫秒(音节长度)及完整句子(未分割)。 文件详解 原始数据文件(30毫秒窗口)...
-
The_Hurricane_Challenge_Interspeech_语音增强数据集_2013
2026年1月11日 30 77 28
数据集概述 本数据集是2013年Interspeech举办的The Hurricane Challenge国际语音清晰度增强评估活动的数据集,包含立体声音频文件,其中通道1为干净语音,通道2为噪声。数据集提供两种噪声类型(平稳语音形状噪声、竞争语音),每种噪声含三种信噪比水平,用于在不改变均方根电平及特定时长约束下增强语音清晰度。 文件详解...
-
语音身份重建研究数据集
2025年12月21日 30 30 6
数据集概述 本数据集为研究论文《Reconstructing Voice Identity from Noninvasive Auditory Cortex Recordings》的配套数据与代码。研究通过深度神经网络构建“语音潜在空间”,分析其与大脑活动的关联,探究听觉皮层对说话人身份信息的表征机制,并实现基于脑活动的语音身份重建。 文件详解...
-
语音增强的Open_Unmix权重数据集
2025年12月20日 30 140 57
数据集概述 本数据集包含基于Voicebank+Demand(二十八说话人版本)训练的Open-Unmix语音增强模型权重,采样率为一万六千赫兹。数据文件类型多样,可适配open-unmix-nnabla与open-unmix-pytorch框架使用。 文件详解 模型权重文件(.pth格式): noise_04a6fc2d.pth:噪声分离模型权重文件...
-
阿拉伯语语音命令数据集
2025年12月16日 30 135 127
数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
-
法国朗伯德语音数据集
2025年12月12日 30 57 44
数据集概述 该数据集包含四十名(二十男二十女)参与者在零、六十五、七十五、八十五分贝四种白噪声条件下产生的朗伯德语音及电声门图(EGG)信号,总时长约八小时,每种噪声条件约两小时,平均每位参与者十二分钟。 文件详解 文件夹结构:包含"calibration"、"raw"、"process"、"txt"四个子文件夹...
-
柏林情感语音数据库2_0
2025年12月10日 30 116 18
数据集概述 该数据集是柏林情感语音数据库2.0版本,包含十位演员(五位女性、五位男性)模拟七种情感录制的约八百句德语日常语句,同时记录了电声门图数据。数据按四位说话人划分为测试集、六位划分为训练集,音频为16kHz WAV格式,元信息采用audformat格式存储,还补充了模糊样本。 文件详解 文件名称: emodb_2.0.zip 文件格式:...
-
可解释语音情感识别中基于情感类别和性别的信息性语音特征附录表
2025年12月9日 30 202 162
数据集概述 本数据集为同名论文的附录表,涵盖基于SHAP值获取的特征信息性内容,包含情感与中性对比、性别间的统计及t检验结果,以及各模型最具信息性的前5个特征表,为语音情感识别研究提供支撑。 文件详解 文件名称:Appendix-Informative Speech Features based on Emotion Classes and...
-
希腊语版坐标响应测量语料库
2025年12月8日 30 24 13
数据集概述 该数据集是坐标响应测量(CRM)语料库的希腊语改编版本,包含八名希腊母语者(四男四女,年龄33-41岁)的语音录音。涵盖8个呼号、4种颜色和8个数字的所有组合,用于语音干扰竞争及空间掩蔽释放研究。 文件详解 文件名称: Greek CRM.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
-
真实世界交流与情感非言语发声数据集_ReCANVo
2025年12月7日 30 16 9
数据集概述 该数据集包含七千零七十七条标注的非言语发声数据,由非语言交流者在家庭、学校等真实场景中产生,每条发声时长约零点五至四秒,由熟悉他们的家长或照护者实时标注情感或交流含义。 文件详解 文件名称: ReCANVo.zip 文件格式: ZIP (.zip) 包含内容:...
-
音频特征情感识别训练数据集
2025年8月30日 30 172 99
音频特征情感识别训练数据集_Audio_Feature_Emotion_Recognition_Training_Dataset 数据来源:互联网公开数据 标签:音频分析, 情感识别, 机器学习, 语音信号处理, 特征提取, MFCC, ZCR, RMS, 数据集构建 数据概述:...
-
语音情感分析多模态数据集
2025年8月14日 30 96 50
语音情感分析多模态数据集_Speech_Emotion_Analysis_Multimodal_Dataset 数据来源:互联网公开数据 标签:语音情感, 多模态, 情感识别, 语音信号处理, 计算机视觉, 面部表情, 语音特征, 数据融合 数据概述: 该数据集包含来自多种模态的数据,记录了用于语音情感分析的多种特征信息。主要特征如下:...
-
家庭环境声音事件识别数据集
2025年7月4日 30 111 95
家庭环境声音事件识别数据集_Home_Environment_Sound_Event_Recognition 数据来源:互联网公开数据 标签:声音事件识别, 音频分类, 机器学习, 深度学习, 声学分析, 语音信号处理, 家庭场景, 数据标注 数据概述: 该数据集包含来自互联网的音频数据,记录了家庭环境中多种声音事件。主要特征如下:...
-
音频说话人识别验证数据集_Audio_Speaker_Recognition_Validation_Dataset
2025年6月25日 30 174 159
音频说话人识别验证数据集_Audio_Speaker_Recognition_Validation_Dataset 数据来源:互联网公开数据 标签:说话人识别, 音频分析, 声纹识别, 语音信号处理, 深度学习, 数据集, 验证集, Titanet 数据概述: 该数据集包含用于音频说话人识别任务的验证数据。主要特征如下:...
-
TIMIT语音识别和发音学研究语料库数据集
2025年6月4日 30 197 28
TIMIT语音识别和发音学研究语料库数据集 数据来源:互联网公开数据 标签:语料库,语音识别,发音标注,语音处理,自然语言处理,美国英语,发音学研究 数据概述:...



