机器学习辅助识别鳄梨果实病害数据集-墨西哥蒙特西略
数据来源:互联网公开数据
标签:鳄梨,果实病害,机器学习,图像分析,随机森林,支持向量机,多层感知器,病害检测,数据集,农业,墨西哥
数据概述:
本数据集源于墨西哥蒙特西略研究生院的硕士论文,旨在利用机器学习技术对鳄梨果实的病害进行分类和检测。数据集包含90张RGB图像,涵盖三种类别:健康果实(S)、患有疮痂病的果实(R)和患有炭疽病的果实(A)。图像经过HSV颜色空间转换后,生成了两个主要的数据集:
BD1. 区域选择:使用IDENTO程序(Ambrosio-Ambrosio & González-Camacho, 2023)选择感兴趣区域。BD1目录包含提取的特征值文件(.txt),而Archivos csv/Datos salida.csv文件则包含了90张图像的对应数据。
BD2. 子采样选择:对图像进行30x30像素的裁剪,选取与病害类别相关的区域。这些裁剪后的图像位于BD2目录下,提取的数值数据保存在Archivos csv/BD135 ClssInv.csv文件中。
通过评估,确定了最佳的特征提取方法为BD1,使用随机森林算法,全局准确率(ACC)达到98%。
进一步评估了多种机器学习算法,包括:
a) 随机森林
b) 支持向量机
c) 多层感知器
最终,随机森林和多层感知器模型表现最佳,均达到98%的准确率。
使用优化后的模型,对已分割的图像进行预测,结果图像分别存储在RF、SVM和MLP文件夹中(Clasificacin CART RF.csv, Clasificacin CART SVM.csv, Clasificacin CART MLP.csv)。最后,使用决策树获取决策阈值,并对每张图像进行预测。
数据用途概述:
该数据集可用于研究鳄梨果实病害的图像识别、机器学习模型训练与评估、农业病害检测技术开发等。研究人员可以利用此数据探索不同的特征提取方法和机器学习算法,构建高效的病害检测模型;农业专家可以利用此数据辅助诊断,提高病害识别的准确性和效率;开发者可以基于此数据集构建移动应用或在线服务,帮助农民及时发现和处理病害。此外,该数据集也适用于机器学习教学和科研,为相关领域的研究提供参考。