环境声音分类数据集ESC-50

环境声音分类数据集ESC-50 数据来源:互联网公开数据
标签:环境声音,分类任务,音频处理,声音识别,机器学习,数据分类,交叉验证,声音分析

数据概述:
本数据集ESC-50包含2000个标注好的5秒环境声音音频片段,设计用于环境声音分类的基准测试。数据集共涵盖50个语义类别(每类40个片段),并分为5个主要类别。所有音频片段均来自Freesound.org,经过手动提取和预处理,并预先划分为5个独立的交叉验证折叠,确保不同折叠间没有源片段的重叠。

数据用途概述:
该数据集适用于多种环境声音分类任务,支持研究人员进行声音分类模型的开发与评估。用户可以通过wav_files文件夹直接获取音频文件,每个文件的类别可通过文件名确定(例如,“1-100032-A-0.wav”对应类别0)。此外,数据集中还提供了“esc50-stats.xlsx”和“esc50_labels.csv”文件,分别用于查看数据统计信息、预测结果和文件分类详情。该数据集适用于声音识别算法的研究、模型性能评估、声音分类应用开发以及相关领域的教育培训。

packageimg

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 30, 2025, 21:36 (UTC)
创建于 五月 30, 2025, 21:33 (UTC)
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。