-
DCASE2024_Task9_Based_语言查询音频源分离验证集数据
2026年1月21日 30 24 12
数据集概述 本数据集是DCASE 2024挑战赛Task 9(语言查询音频源分离)的验证集,包含1000个来自Freesound的音频文件及对应元数据,支持模型开发阶段的性能评估。音频已处理为10秒16kHz片段,每个文件配3条人工标注字幕,标签参考FSD50K规范,可用于生成无重叠类别的合成混合音频。 文件详解 lass_validation.zip...
-
监控应用场景声音事件数据集
2025年12月23日 30 95 49
数据集概述 该数据集包含用于监控应用场景的声音事件数据,分为训练集和测试集,涵盖无威胁、枪声、爆炸声、警报声等四类声音事件,所有音频为特定参数的WAV格式,整体打包为ZIP文件。 文件详解 文件名称: SESA.zip 文件格式: ZIP (.zip) 文件内容: 压缩包内包含两类文件夹: train: 480个WAV格式音频文件,单声道、16...
-
DBR_Source_Based_环境音频数据分类数据集
2025年12月15日 30 176 130
数据集概述 该数据集是为坦佩雷理工大学信号处理学士研讨会创建的环境音频数据集,包含狗、鸟、雨三类音频样本,每类50个,数据来自Freesound在线音频数据库。 文件详解 文件名称: dbr-dataset.zip 文件格式: ZIP压缩包 内部内容: 三个分类文件夹(dog、bird、rain),各含50个原始WAV音频文件...
-
Freesound单音打击乐声音数据集
2025年12月8日 30 87 82
数据集概述 本数据集包含来自Freesound.org的一万零二百五十四条单音(单次事件)打击乐声音,以及对应的音色分析数据。这些数据曾用于训练“基于高级音色特征参数化的神经打击乐合成”生成模型。 文件详解 核心文件(根目录):...



