植物是地球生态系统中不可或缺的一环,更与人类的生存环境密切相关,植物健康问题直接影响人们的生产生活质量。近年来基于图像信息分析算法的植物特征识别分类技术研究已经迅速成为全球植物信息学方面的主要研究热点。植物信息的识别分类及识别结果一般以植物叶片的外观形态、叶片纹理、叶片颜色变化等信息作为主要依据[1],它的优势在于植物叶片存活时间较长且采集图像更加便利。传统意义上植物叶片标本识别系统和鉴别检测方法大多需要通过人工仪器对叶标本逐一进行识别采集和检测鉴定,工作量大,且系统效率低,会导致研究者依据有限的感官经验以及个人直觉来影响最终识别鉴定结果。随着信息科技事业的深入发展,计算机视觉、图像信息处理等技术正在不断发展并趋于成熟,利用现代计算机视觉技术快速对各种植物叶片特征进行分析并对健康状况进行识别成为最有效可靠的判别方法。
国内外学者对植物识别进行了大量研究,取得了一系列重要的研究成果。翟传敏等[2]使用基于关系结构匹配的方法,对特征点进行匹配操作后利用动态规范算法,取得了较为准确的植物叶片识别结果。杨维等[3]把粒子群优化算法用在形状匹配上,然后依据匹配的差异度实现叶片识别。王艳菲[4]将基于CENTRIST的特征提取算法用于对植物叶片特征提取,得到了较为准确的识别结果。谭峰等[5]通过先计算叶片色度值再建立多层BP神经网络模型的方法,实现了对大豆植物叶片的识别和病害检测。田有文等[6]通过提取葡萄病叶的颜色特征和纹理特征,得出利用支持向量机算法可以取得更好的识别效果。王献锋等[7]对叶片病斑的颜色、形状和纹理等特征进行提取,并结合植物生存的环境信息,利用判别分析法实现了对黄瓜病斑类别的识别。以上研究表明,利用植物叶片特定的图像特征结合传统的分类方法对植物的健康状况进行识别具有一定的效果,但以上研究所选的实验样本数量有限,或所选植物叶片样本均取自同一种植物,所以这些方法的实现仅局限于对某一种植物进行叶片病害识别。近年来卷积神经网络(convolutional neural networks,CNN)快速兴起,在图像识别领域被广泛应用。AlexNet、GoogLeNet和ResNet等卷积神经网络模型在图像识别领域中都获得了不错的效果。越来越多的研究者[8⇓⇓⇓-12]将这些模型使用在农业图像识别中,利用卷积神经网络技术对植物叶片的分类开展研究。Sladojevic等[13]、Brahimi等[14]、Matin等[15]利用卷积神经网络对植物叶片病害进行识别,分别使用微调方法在模型CaffeNet和AlexNet上做出改进,得到了比较不错的识别效果。以上研究证明,利用卷积神经网络识别植物叶片病害的方法是可行的,但缺点也很明显,这些模型的参数量大,训练花费的时间较长,且模型不方便使用。
本研究以芒果、柠檬和石榴3种植物健康和病害叶片为研究对象,提取3种植物健康和病害叶片表型特征(包括颜色特征、形状特征和纹理特征),并用PCA方法对提取的纹理特征数据降维,然后建立BP神经网络模型,对植物叶片健康状态进行自动识别。
1.1 数据集
本研究采用公开数据集,从中选取芒果、柠檬、石榴3种植物。其中芒果病害图像265张、健康图像170张,柠檬病害图像77张、健康图像159张,石榴病害图像272张、健康图像287张。图像背景单一,每张图像均为单一叶片。部分图像如图1所示。
1.2 预处理
为更好地对植物叶片病害进行识别,首先对收集到的图像进行去噪处理。常用的去噪处理主要有均值滤波、中值滤波和高斯滤波[16]。分别采用上述方法对植物叶片图像进行去噪处理,结果如图2所示。从结果可以看出不同去噪方法效果区别不大。
图像分割的好坏直接影响后续植物叶片健康状态识别结果。K-means算法近年来被广泛应用在图像分割中,取得了不错的效果[17⇓-19]。因此本研究采用K-means算法对植物叶片进行分割。首先将去噪后的图像从彩色空间转换到Lab空间,然后取出Lab空间的a分量和b分量作为聚类数,聚类个数设置为2,提取植物叶片病斑区域。分割后效果图如图3所示。其中3b、3c为芒果病害叶片分割后图像,3e、3f为柠檬病害叶片分割后图像,3h、3i为石榴病害叶片分割后图像,较好地分割出了病斑区域和叶片区域。
2.1 提取颜色特征
分别提取分割后芒果、柠檬、石榴健康和病害叶片的RGB和HSV颜色特征数据。首先分别提取R、G和B 3个通道上的颜色值。然后将原始图像由RGB模型转换为HSV模型,分别提取H、S和V 3个通道上的颜色值。图4~5中横坐标对应叶片图像标号,纵坐标表示颜色值。不同叶片的颜色数据值差距较大,可以作为植物叶片识别依据。
2.2 提取形状特征
分别提取分割后芒果、柠檬和石榴叶片的形状特征,包括周长、面积、质心、长轴长度和短轴长度比例、离心率和似圆性6个特征值,记录数据以便后续使用。提取的部分特征数据如表1所示。
表1 部分形状特征提取数据 类别 周长/mm 面积/mm² 质心/mm 长短轴之比 离心率 似圆性 1 1955.716 221411 359.8323778 1.506073975 0.7477521 -0.232831622 2 1955.716 218496 360.026799 1.498772904 0.744867434 -0.241925897 3 2785.082 108624 450.2232819 2.596794006 0.922878928 11.54332354 4 3858.01 118174 408.8239076 1.951608902 0.858748247 0.548939342 5 1955.716 212807 360.9768233 1.496645718 0.744016899 -0.236452475 6 1955.716 212581 359.240866 1.507050405 0.748133878 -0.479311432注:类别表示对植物叶片做好的分类标记,1代表芒果病害叶片,2代表芒果健康叶片,3代表柠檬病害叶片,4代表柠檬健康叶片,5代表石榴病害叶片,6代表石榴健康叶片。2.3 提取纹理特征
纹理特征是图像中非常重要的特征,它为模式识别和理解提供了大量的信息[20]。小波变换在提取图像特征时存在以下优点:(1)小波变换分解可以包含整个频域,提供了数学意义上完备的描述;(2)小波变换利用选择合适的滤波器在很大程度上降低或消除提取到的不同特征之间的相关性;(3)小波变换具有“变焦”特性,在低频段可用高频率分辨率和低时间分辨率(宽分析窗口),在高频段可用低频率分辨率和高时间分辨率(窄分析窗口)。基于以上小波变换的优点,本研究采用小波变换来提取植物叶片的纹理特征。
使用小波变换提取芒果、石榴、柠檬的纹理特征,在0°、45°、90°、135°方向上分别提取2×2、2×4、4×2、4×4滤波的均值、对比度、熵和相似性。由于提取的纹理特征值数量较多,采用主成分分析法PCA对提取的特征数据降维[21]。实验表明,当采用PCA降维时,特征分量维度设置为6个,效果较好。图6为样本纹理特征数据分布,其中横坐标表示叶片图像标号,纵坐标表示纹理值,A、B、C、D、E、F 6个不同颜色的线段表示PCA降维得到的6个分量的分布。
3.1 构建数据集
构建植物病害识别模型之前,先对样本进行分集,构建训练集和测试集。按照7:3随机将数据集划分为训练集和测试集保存,训练集858个样本,测试集372个样本,具体分集结果如表2所示。
表2 6种植物叶片分集样本数 个 类别 训练集 测试集 总计 芒果病害 185 80 265 芒果健康 119 51 170 柠檬病害 53 24 77 柠檬健康 111 48 159 石榴病害 190 82 272 石榴健康 200 87 287 总计 858 372 12303.2 构建BP植物叶片病害识别模型
BP神经网络是目前研究最多且使用范围最广泛的前馈神经网络。BP神经网络是使用误差反向传播算法的多层前馈人工神经网络(或称多层感知器)。BP神经网络一般拥有3层或多层结构,分别是输入层、隐含层和输出层,其中隐含层可有多层。它的基本原理是梯度下降法。利用改变一层与另外层之间传输权值的方法,实现整个网络输出值与期望值存在误差均方值最小的结果。关于BP神经网络的训练可以分成正向传播过程和反向反馈过程。在正向传播过程中信号由输入层输入,经过输入层与隐含层时加入权值信息并进行计算,进入隐含层,再经过加权处理进入输出层,得到实际输出。在反向反馈过程中,利用权值调整公式根据当前实际误差对权值进行调整。重复正向传播与反向反馈过程,直至输出结果满足要求。
BP神经网络被广泛应用于语音分析、图像识别、数字水印、计算机视觉等很多领域,取得了许多突出的成果。刘文宇等[22]提出基于BP神经网络的智能电能表误差估计方法以解决配电网台区中智能电能表误差估计问题。程冀文等[23]为了探究沙柳生物量估算模型的最优形式,建立了基于BP神经网络的沙柳生物量模型。刘坤等[24]采用改进BP神经网络结合颜色特征和纹理特征的方法对黄瓜叶病害进行识别,取得了较好的效果。王小敏等[25]利用图像处理技术和BP神经网络算法对茶叶病害进行识别,最终得到非常高的识别率。
本研究构建BP神经网络植物叶片病害识别模型。设置隐含层10层,输出层个数为6,迭代次数为10000,创建神经网络并设置其他训练参数。最终设置模型如图7所示。
为了更好地对比实验效果,对提取的颜色、纹理和形状特征设置了4种识别方法。分别是基于颜色+纹理+形状特征的多种植物叶片病害识别方法、基于纹理+形状特征的多种植物叶片病害识别方法、基于颜色+纹理特征的多种植物叶片病害识别方法、基于颜色+形状特征的多种植物叶片病害识别方法。将上述保存好的训练数据输入建立好的BP神经网络模型进行训练,并用测试数据进行测试。
从表3可知,在建立的BP神经网络植物叶片病害识别模型中,基于颜色+纹理+形状特征的叶片识别率最高为83.9%,在该模式下,芒果、柠檬、石榴叶片病害识别中,芒果的健康状况识别率最高,石榴病害状态识别率较低。结果表明,采用基于颜色+纹理+形状特征的BP神经网络方法可以有效实现多种植物叶片病害识别。
表3 不同特征融合植物病害识别结果 方法 类别 检出数/个 样本数/个 正确率/% 总体识别正确率/% 颜色+纹理+形状 芒果病害 79 80 98.8 83.9 芒果健康 47 51 92.2 柠檬病害 17 24 70.8 柠檬健康 39 48 81.3 石榴病害 44 82 53.7 石榴健康 86 87 98.9 纹理+形状 芒果病害 77 80 96.3 79.0 芒果健康 45 51 88.2 柠檬病害 13 24 54.2 柠檬健康 24 48 50.0 石榴病害 59 82 72.0 石榴健康 76 87 87.4 颜色+纹理 芒果病害 79 80 98.8 78.8 芒果健康 35 51 68.6 柠檬病害 17 24 70.8 柠檬健康 34 48 70.8 石榴病害 47 82 57.3 石榴健康 81 87 93.1 颜色+形状 芒果病害 79 80 98.8 66.4 芒果健康 46 51 90.2 柠檬病害 12 24 50.0 柠檬健康 38 48 79.2 石榴病害 20 82 24.4 石榴健康 52 87 59.8笔者以芒果、柠檬和石榴3种植物叶片为研究对象,实现多种植物叶片健康状况自动识别。收集芒果叶片健康和病害图像、柠檬健康和病害图像以及石榴健康和病害图像,提取颜色、形状和纹理多种叶片表型特征,建立BP神经网络叶片健康状态识别模型。在纹理特征提取中,采用小波变换获得叶片纹理特征,并用PCA降维。采用颜色+纹理+形状、纹理+形状、颜色+纹理和颜色+形状4种多特征组合方式构建BP神经网络多种植物叶片病害识别模型来判断植物的健康状况。对比不同特征组合识别模型,表明利用颜色+纹理+形状建立的BP神经网络多种植物叶片病害识别模型正确率要高于利用其他特征建立的模型,准确率可达83.9%。本研究采用的方法可以有效实现多种植物健康状态识别,在大规模植物作物健康株和病变株识别中提高治理效率。
植物病害自动识别对于实现农业现代化具有重要意义。植物病害主要发生在叶片部位,可以通过叶片病害特征发现植物感染病害类型,做到早发现早治疗,将损失降到最低[26]。快速准确检测植物病害已经成为近年农业领域的研究热点。本研究采用颜色、纹理、形状多特征融合的方式,建立BP神经网络模型对芒果、柠檬和石榴3种植物健康状况进行自动识别,取得了不错的效果。但该研究方法对于其他植物病害自动识别效果是否显著还需进一步考证。由于植物病害区域有时较小,对于病斑区域分割方法还有待进一步改善。
山西省基础研究计划“基于深度学习的育肥猪异常行为检测及个体跟踪方法研究”(202103021223141)
山西农业大学青年科技创新基金“基于深度学习的小麦病害识别与应用研究”(2020QC17)
{{custom_fund}}相关知识
基于粗糙集和BP神经网络的棉花病害识别
基于BP神经网络的农作物虫害预测系统的研究
基于神经网络的食用玫瑰花图像识别算法
基于深度学习的苹果叶片病害识别研究
基于BP神经网络的棉花病虫害诊断系统
基于环境因子的黄瓜病害预测研究
基于BP神经网络对鸢尾花的分类的研究
基于叶片图像多特征融合的观叶植物种类识别
基于神经结构搜索的多种植物叶片病害识别
基于改进卷积神经网络的苹果叶部病害识别
网址: 基于多特征的BP神经网络多种植物叶片病害识别研究 https://m.huajiangbk.com/newsview1421415.html
上一篇: 基于YOLOv8深度学习的植物叶 |
下一篇: 基于轻量级残差网络的植物叶片病害 |