数据集概述
本数据集用于研究众包场景下的强标签估计,包含20个由Scaper生成的合成音频文件、参考标注及众包标注结果。音频源自freesound.org的Urban Sound 8k数据集片段,标注通过Amazon Mechanical Turk完成,可支持声音事件检测的众包标签处理研究。
文件详解
- LICENSE.txt
- 文件格式:TXT
- 内容介绍:数据集许可说明文件
- README.md
- 文件格式:MD
- 内容介绍:数据集详细说明,包括背景、作者信息及数据组成
- meta.zip
- 文件格式:ZIP
- 内容介绍:元数据压缩包,包含参考标注、估计强标签及音频标签等元数据
- files_mapping.csv
- 文件格式:CSV
- 字段映射:包含extracted(提取文件名)、label(标签)、saliency(显著性)、freessound_id(Freesound ID)、start(起始时间)、end(结束时间)等字段
- FREESOUNDCREDITS.txt
- 文件格式:TXT
- 内容介绍:Freesound音频来源的致谢清单
- audio.zip
- 文件格式:ZIP
- 内容介绍:20个合成音频文件压缩包,每个音频时长3分钟
数据来源
Tampere University Machine Listening Group
适用场景
- 众包强标签估计研究:分析多标注者场景下强标签的生成与优化方法
- 声音事件检测:利用合成音频及标注数据训练和评估声音事件检测模型
- 众包标注质量评估:研究众包标注结果的一致性与准确性
- 音频合成与标注:探索Scaper工具生成的合成音频在标签估计中的应用价值