数据集概述
本数据集包含基于卷积神经网络(CNN)的浮游生物图像自动分析相关的训练库、测试集、验证集及配套脚本程序,来自Luo等人发表于《Limnology and Oceanography Methods》的研究。数据支持浮游生物图像的分类模型训练、阈值过滤设置及混淆矩阵计算,共含9个文件。
文件详解
- 训练库
- 文件名称:Luo_etal_training_library.tar.gz
- 文件格式:tar.gz
- 字段映射介绍:包含42,564个样本的训练库,分为108个类别
- 过滤阈值测试集
- 文件名称:Luo_etal_FT_images.tar.gz
- 文件格式:tar.gz
- 字段映射介绍:包含42,548个独立于训练库的测试样本,分为38个组,用于设置分类后过滤阈值
- 文件名称:Luo_etal_FT_images_pred.csv
- 文件格式:CSV
- 字段映射介绍:含图像名称、预测类别、预测概率、验证组字段
- 混淆矩阵验证集
- 文件名称:Luo_etal_confusionmatrix_validated.tar.gz
- 文件格式:tar.gz
- 字段映射介绍:包含75,000个随机验证样本,分为38个组,用于混淆矩阵计算
- 文件名称:Luo_etal_confusionmatrix_images.csv
- 文件格式:CSV
- 字段映射介绍:含文件夹、验证组、图像名称、预测概率、预测类别字段
- 类别映射文件
- 文件名称:class_to_group.csv
- 文件格式:CSV
- 字段映射介绍:含class(类别)、group(组)字段,用于类别与组名的匹配
- 脚本程序
- 文件名称:Segmentation.zip
- 文件格式:zip
- 字段映射介绍:包含分割程序的脚本和可执行文件
- 文件名称:plankton_template.zip
- 文件格式:zip
- 字段映射介绍:包含手稿中使用的SparseConvNet程序归档版本
- 文件名称:plankton_epoch-150.cnn
- 文件格式:cnn
- 字段映射介绍:手稿中训练使用的权重文件,需放入/weights文件夹以复现分类
数据来源
论文“Automated plankton image analysis using convolutional neural networks”(Luo et al., Limnology and Oceanography Methods)
适用场景
- 浮游生物图像分类模型训练: 利用训练库数据训练基于CNN的浮游生物自动识别模型
- 图像分类阈值优化: 通过测试集数据设置分类后的过滤阈值,提升分类准确性
- 模型性能评估: 使用验证集数据计算混淆矩阵,评估浮游生物分类模型的性能
- 海洋生物监测: 应用自动分析模型实现浮游生物图像的快速识别与计数,支持海洋生态监测
- 计算机视觉算法研究: 基于浮游生物图像数据探索CNN及SparseConvNet在生物图像识别中的应用