2024鸟类识别挑战赛声音景观标注数据集-richolson
数据来源:互联网公开数据
标签:鸟类识别,声音景观,标注数据,机器学习,数据科学,竞赛数据,音频处理,生态学
数据概述:
本数据集包含100个标注的声音景观文件,专为2024年鸟类识别挑战赛(BirdCLEF 2024)生成。这些声音景观文件由Kaggle上的BirdTrax项目生成(https://www.kaggle.com/code/richolson/birdtrax-birdclef-2024-labeled-soundscapes),基于竞赛训练数据的50%。数据集的生成过程具有可重复性,具体设置详见相关笔记本。
数据文件labeled_soundscapes.csv的格式与竞赛提交文件submission.csv相同。数据集生成时采用了以下参数设置:
- 生成文件数量:100个
- 每种鸟类的重叠文件数量:3个
- 鸟类调色板大小:16种
- 最小质量标准:4
- 同时存在的鸟类种类数量上限:4种
- 是否减少噪声:否
- 通道中鸟类种类变化的概率:0.3
- 评估时通道启用的概率:0.4
- 通道启用的概率:0.7
数据用途概述:
该数据集适用于鸟类识别算法的开发和评估、声音景观分析、音频处理技术研究以及生态学领域的相关研究。研究人员和开发者可以利用此数据集进行机器学习模型的训练和验证,提高鸟类识别的准确性和鲁棒性。此外,该数据集也适合用于教学和科普,帮助公众了解鸟类识别技术和声音景观分析的重要性。