城市环境声音分类识别声谱图数据集-UrbanSound8K-smaildurcan
数据来源:互联网公开数据
标签:声音,声谱图,城市,环境,分类,音频,机器学习,深度学习,UrbanSound8K
数据概述:
本数据集包含8732个标注的城市声音片段(时长小于等于4秒)的声谱图图像,源自10个不同的声音类别,包括:空调、汽车喇叭、儿童玩耍、狗叫、电钻、引擎空转、枪声、电钻、警笛和街头音乐。这些声音类别基于城市声音分类体系进行划分。数据集中提供的图像均为.png格式。
除了声谱图图像外,数据集还附带一个CSV文件,其中包含关于每个声音片段的元数据信息。
元数据文件(UrbanSound8k.csv)包含以下字段:
slice_file_name:音频文件名,格式为 [fsID]-[classID]-[occurrenceID]-[sliceID].wav,其中:
[fsID]:Freesound录音的ID
[classID]:声音类别的数字标识符
[occurrenceID]:区分原始录音中不同声音出现次数的数字标识符
[sliceID]:区分从同一出现位置截取的不同片段的数字标识符
fsID:Freesound录音的ID
start:片段在原始Freesound录音中的开始时间
end:片段在原始Freesound录音中的结束时间
salience:声音的(主观)显著性评级,1 = 前景,2 = 背景
fold:该文件被分配到的折叠编号(1-10)
classID:声音类别的数字标识符,0-9对应于上述10个类别
class:声音类别的名称,例如:air_conditioner, car_horn等
数据用途概述:
该数据集主要用于城市环境声音的识别、分类和分析,适用于机器学习、深度学习等领域的研究和应用。研究人员可以使用该数据集训练和评估声音分类模型,开发智能音频分析系统,或进行城市环境声音的特征提取与分析。具体应用场景包括:
1. 声音事件检测:检测城市环境中的特定声音事件。
2. 智能监控:用于智能监控系统,检测异常声音。
3. 城市噪声监测:用于城市噪声污染的监测与分析。
4. 声音场景理解:用于理解复杂的城市声音场景。