数据集

城市环境声音分类识别声谱图数据集-UrbanSound8K-smaildurcan

城市环境声音分类识别声谱图数据集-UrbanSound8K-smaildurcan 数据来源：互联网公开数据标签：声音,声谱图,城市,环境,分类,音频,机器学习,深度学习,UrbanSound8K

数据概述：本数据集包含8732个标注的城市声音片段（时长小于等于4秒）的声谱图图像，源自10个不同的声音类别，包括：空调、汽车喇叭、儿童玩耍、狗叫、电钻、引擎空转、枪声、电钻、警笛和街头音乐。这些声音类别基于城市声音分类体系进行划分。数据集中提供的图像均为.png格式。除了声谱图图像外，数据集还附带一个CSV文件，其中包含关于每个声音片段的元数据信息。

元数据文件（UrbanSound8k.csv）包含以下字段：

slice_file_name：音频文件名，格式为 [fsID]-[classID]-[occurrenceID]-[sliceID].wav，其中： [fsID]：Freesound录音的ID [classID]：声音类别的数字标识符 [occurrenceID]：区分原始录音中不同声音出现次数的数字标识符 [sliceID]：区分从同一出现位置截取的不同片段的数字标识符 fsID：Freesound录音的ID start：片段在原始Freesound录音中的开始时间 end：片段在原始Freesound录音中的结束时间 salience：声音的（主观）显著性评级，1 = 前景，2 = 背景 fold：该文件被分配到的折叠编号（1-10） classID：声音类别的数字标识符，0-9对应于上述10个类别 class：声音类别的名称，例如：air_conditioner, car_horn等

数据用途概述：该数据集主要用于城市环境声音的识别、分类和分析，适用于机器学习、深度学习等领域的研究和应用。研究人员可以使用该数据集训练和评估声音分类模型，开发智能音频分析系统，或进行城市环境声音的特征提取与分析。具体应用场景包括： 1. 声音事件检测：检测城市环境中的特定声音事件。 2. 智能监控：用于智能监控系统，检测异常声音。 3. 城市噪声监测：用于城市噪声污染的监测与分析。 4. 声音场景理解：用于理解复杂的城市声音场景。

数据与资源

versions_20250402105258.zipZIP
418.88 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	418.88 MiB
最后更新	2025年5月31日
创建于	2025年5月31日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。