MAESTRO_Synthetic_多标注者强标签估计数据集_2021

数据集概述

本数据集用于研究众包场景下的强标签估计,包含20个由Scaper生成的合成音频文件、参考标注及众包标注结果。音频源自freesound.org的Urban Sound 8k数据集片段,标注通过Amazon Mechanical Turk完成,可支持声音事件检测的众包标签处理研究。

文件详解

  • LICENSE.txt
  • 文件格式:TXT
  • 内容介绍:数据集许可说明文件
  • README.md
  • 文件格式:MD
  • 内容介绍:数据集详细说明,包括背景、作者信息及数据组成
  • meta.zip
  • 文件格式:ZIP
  • 内容介绍:元数据压缩包,包含参考标注、估计强标签及音频标签等元数据
  • files_mapping.csv
  • 文件格式:CSV
  • 字段映射:包含extracted(提取文件名)、label(标签)、saliency(显著性)、freessound_id(Freesound ID)、start(起始时间)、end(结束时间)等字段
  • FREESOUNDCREDITS.txt
  • 文件格式:TXT
  • 内容介绍:Freesound音频来源的致谢清单
  • audio.zip
  • 文件格式:ZIP
  • 内容介绍:20个合成音频文件压缩包,每个音频时长3分钟

数据来源

Tampere University Machine Listening Group

适用场景

  • 众包强标签估计研究:分析多标注者场景下强标签的生成与优化方法
  • 声音事件检测:利用合成音频及标注数据训练和评估声音事件检测模型
  • 众包标注质量评估:研究众包标注结果的一致性与准确性
  • 音频合成与标注:探索Scaper工具生成的合成音频在标签估计中的应用价值
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 563.45 MiB
最后更新 2026年1月23日
创建于 2026年1月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。