本发明涉及农作物病虫害预测,具体为一种基于人工智能的农作物病虫害预测方法。
背景技术:
1、随着人口增长和全球粮食需求的上升,提高农作物的产量和质量变得尤为重要。然而,农作物生产过程中经常受到各种病虫害的影响,这不仅损害作物健康,还可能导致严重的经济损失。传统的病虫害监测和管理方法依赖于农民的经验和定期的田间检查,这种方法既费时又费力,而且准确性有限。随着遥感技术、人工智能和大数据分析技术的发展,出现了新的机遇来改善这一状况。利用这些技术,可以更精确、更高效地监测和预测农作物病虫害,从而实现精准农业管理。
2、现有技术如公开号为:cn202311187586.2的发明专利申请明公开了一种林业植物病虫害短期预测方法及系统,涉及植物病虫害预测技术领域,该方法包括:获得植物基础特征矩阵;获得多个植物图像数据;进行病虫害分析,获得多个植物病虫害识别结果;生成植物初始状态矩阵;根据环境拟合端和第一预测时区分别对目标区域内的多个林业植物进行生长环境拟合;获得多个植物状态预测结果;基于多个植物病虫害识别结果、预测生长环境信息集和多个植物状态预测结果,生成植物状态分析报告,进行运维决策分析,获得植物生长运维决策。本发明解决了现有技术中林业植物病虫害短期预测结果可靠性低,预测反馈周期长的技术问题,达到了提升短期预测效率,提高预测准确性的技术效果。
3、现有技术如公开号为:cn202310753085.x的发明专利申请明公开了一种基于随机森林及元胞自动机的果树病虫害防治预测方法;基于周围元胞的状态和其他环境因素,通过合适的模型和规则来更新元胞的状态。这些规则可以基于历史数据、气象条件、土壤状况、害虫传播模式等因素进行定义。一、精准预测:通过结合元胞自动机和随机森林模型,该方法可以精准地预测果树病虫害的发生和传播情况。随机森林模型能够利用历史数据和环境因素来进行预测,提高了预测的准确性和可靠性。二、及时响应:该方法能够实时监测果树病虫害的风险状况,并根据预测结果快速调整防治策略。通过元胞自动机的演化规则,可以模拟果树的状态变化和病虫害的传播过程,及时发现风险区域,并采取相应的预防措施。
4、现有技术如公开号为:cn202211143610.8的发明专利申请明公开了一种基于机器视觉的农作物病虫害预测方法、系统及存储介质,方法包括:获取目标农作物的第一图像信息,对第一图像信息进行边缘检测得到目标农作物的若干个叶片轮廓,并根据叶片轮廓提取出叶片图像信息;将叶片图像信息输入到预先训练好的病变区域识别模型,得到目标农作物的病变类型,并提取出叶片病变区域;获取目标区域的第一气象指标信息和第一环境指标信息;将第一气象指标信息、第一环境指标信息以及叶片病变区域输入到预先训练好的病虫害预测模型,得到目标农作物的病虫害预测结果。本发明提高了农作物病虫害预测的效率,也提高了农作物病虫害预测的准确性和可靠性,可广泛应用于农作物灾害预测技术领域。
5、结合上述方案发现,传统方法可能存在训练数据集的覆盖范围和多样性不足,从而影响模型的泛化能力和预测准确性,现有技术可能未能充分特征提取,导致从复杂的农业数据中提取关键特征的效率和准确性不足,传统的分类方法在处理复杂的农业数据时准确度不高,泛化能力有限。
技术实现思路
1、针对现有技术的不足,本发明提供了一种基于人工智能的农作物病虫害预测方法,能够有效解决上述背景技术中涉及的问题。
2、为实现以上目的,本发明通过以下技术方案予以实现:一种基于人工智能的农作物病虫害预测方法,包括:s1、数据采集与标注;s2、数据预处理;
3、s3、数据扩充;s4、数据特征提取;s5、特征降维;s6、训练分类器。
4、进一步地,所述数据来源于采集得到的农业遥感图像,采集的图像应涵盖不同种类的农作物、不同的生长阶段以及各种病虫害情况,所述采集的图像具有统一的格式和分辨率,图像格式为jpeg格式,分辨率为1024x1024像素。
5、进一步地,所述数据采集与标注中,所述标注类别包括正常生长、虫害、病害、营养不良等,所述标注方法为人工标注。
6、进一步地,所述数据预处理中,对采集到的数据进行预处理,采用归一化处理的方式,可以表示为:
7、;
8、其中,为归一化后的像素值,为原始像素值,和分别为数据集的均值和标准差。
9、进一步地,所述数据扩充包括,基于黎曼流形编码的生成对抗网络算法,基于黎曼流形编码的生成对抗网络的训练过程如下:
10、初始化:设定生成器和鉴别器的网络参数,在生成器中,网络参数表示为和,其中表示权重,表示偏置;在判别器中,网络参数表示为和,其中表示权重,表示偏置;
11、黎曼流形编码处理:对原始数据进行黎曼流形编码,提取数据的内在特征和结构信息,为生成器提供先验知识,具体的,对于输入数据,计算其黎曼流形坐标,可以表示为;
12、;
13、其中,代表黎曼流形的均值点,为对数映射;
14、所述数映射通过将数据点映射到黎曼流形的切空间计算得到,也即,通过求解黎曼流形上的最优化问题进行获取,可以表示为:
15、;
16、其中,表示黎曼流形上的距离函数,是指数映射,是切向量;
17、生成器训练:使用编码后的数据训练生成器,生成器尝试创建新的图像数据,这些数据在视觉和统计特征上与真实数据相似,具体的,生成器的目标是最小化与真实数据的差异,以表示生成器的输入噪声,生成数据可以表示为:
18、;
19、其中,表示生成器函数;
20、所述生成器的输出是通过一系列卷积层和非线性激活函数的组合得到,可以表示为:
21、;
22、其中,是relu非线性激活函数,和是第层的权重和偏置;
23、鉴别器训练:鉴别器接收来自生成器的图像和真实数据集的图像,其目标是准确区分这两类图像,具体的,鉴别器的目标是最大化其识别真实和生成数据的能力,其输出对于真实数据和生成数据可以表示为:
24、
25、;
26、其中,表示鉴别器函数,和分别表示鉴别器的权重和偏置;
27、与生成器类似,所述鉴别器通过多层卷积和非线性激活函数计算输出,其结构可以表示为:
28、;
29、其中,是非线性激活函数,和是第层的权重和偏置;
30、对抗过程:生成器和鉴别器在对抗中不断学习和调整,生成器致力于生成越来越难以被鉴别器识别的图像,而鉴别器则努力提高其识别真伪的准确性,具体的,对抗过程中的生成器和鉴别器的损失函数和分别定义为:
31、
32、;
33、其中,是真实标签,是输入噪声的第个样本;
34、模型优化和评估:通过评估生成图像的质量和多样性,不断调整生成器和鉴别器的参数,具体的,优化过程涉及调整和以最小化和最大化,通过梯度下降方法实现,可以表示为:
35、
36、;
37、其中,是学习率;
38、数据扩充结果:经过多轮训练和优化后,生成器能够产生高质量的扩充数据,将生成的数据与原始数据合并,组成扩充后的训练样本数据集。
39、进一步地,所述数据特征提取包括,基于核密度估计蚁群算法的神经网络,基于核密度估计蚁群算法的神经网络的训练流程如下:
40、核密度估计:应用核密度估计分析数据分布,识别出农作物图像中的关键区域,如受病虫害影响的区域,具体的,对于每个数据点,核密度的估计可以表示为:
41、;
42、其中,是高斯核核函数;是样本数量;是带宽参数,带宽参数选择通过交叉验证来优化,其通过最小化均方误差来估计,可以表示为:
43、;
44、其中,是样本标准差,是样本数量;
45、蚁群算法特征选择:使用蚁群算法算法在核密度估计识别的关键区域中选择最具影响力的特征,具体的,蚁群算法通过模拟蚂蚁寻找食物的路径来优化特征选择,每条蚂蚁的路径可以表示为一个特征选择的概率,计算方式可以表示为:
46、;
47、其中,表示特征的信息素浓度;表示特征的启发式信息,(为特征的重要性),由交叉验证得到;和是控制信息素重要性和启发式信息的参数;
48、所述信息素浓度的更新方式可以表示为:
49、;
50、其中,是信息素挥发率,是第只蚂蚁在特征上留下的信息素量;
51、神经网络训练:将选定的特征输入到神经网络中,进行特征深度提取,具体的,神经网络的训练通过最小化损失函数来实现,本发明考虑使用交叉熵损失函数,对于神经网络输出和真实标签,损失函数可以表示为:
52、;
53、其中,是批次中的样本数;
54、所述神经网络的输出由预设的softmax分类函数得到,即,将特征提取后的特征向量输入到softmax分类函数中,得到输出,softmax函数可以表示为:
55、;
56、其中,是输出层的神经元数,代表可能的特征类别;
57、优化和调整:根据特征提取的结果,不断调整和优化神经网络的参数和结构,以提高特征提取的准确性,具体的,网络参数的优化通过反向传播和梯度下降法实现,对于权重和偏置,更新规则为:
58、
59、;
60、其中,是学习率,一般设置为0.001或通过交叉验证选择;
61、所述权重和偏置的更新通过链式法则计算,可以表示为:
62、
63、;
64、其中,是损失函数对神经网络输出的梯度,和分别是神经网络输出对权重和偏置的梯度;
65、特征提取后的特征向量通常为高维向量,其维度取决于最后一层神经元的数量。
66、进一步地,所述特征降维包括,基于潜在狄利克雷分配的稀疏自编码器结构,基于潜在狄利克雷分配的稀疏自编码器的训练过程如下:
67、数据预处理:对特征提取后的特征向量进行标准化处理,确保数据位于相同的尺度上;
68、自编码器编码阶段:通过非线性变换,将高维数据映射到低维空间,形成稀疏的特征表示,具体的,设为数据预处理后的输入特征,编码器将映射到低维表示,可以表示为:
69、
70、其中,和分别是编码器的权重和偏置,是relu激活函数;
71、所述relu激活函数的原理可以表示为:
72、
73、潜在狄利克雷分配应用:将编码后的特征表示作为潜在狄利克雷分配模型的输入,从而识别数据中的潜在主题和模式,具体的,在编码后的特征上应用潜在狄利克雷分配得到主题分布的过程可以表示为:
74、
75、其中,和是潜在狄利克雷分配的超参数,分别控制主题分布的稀疏性和词分布的稀疏性;
76、自编码器解码阶段:将低维特征表示重建回原始数据空间,目的是最小化重建误差,同时保留关键信息,具体的,解码器将低维表示重建回原始特征空间,得到重建特征,可以表示为:
77、
78、其中,和是解码器的权重和偏置,是sigmoid激活函数;
79、所述sigmoid函数的原理可以表示为:
80、
81、所述损失函数包括重建误差和稀疏性惩罚,可以表示为:
82、
83、其中,是稀疏性惩罚系数,是kullback-leibler散度,是主题分布的先验;
84、所述kl散度用于衡量两个概率分布间的差异,对于潜在狄利克雷分配中的主题分布和先验分布,kl散度的计算方式可以表示为:
85、
86、其中,是主题的数量,和分别是和中第个元素;
87、模型优化:通过调整自编码器的参数和潜在狄利克雷分配模型的超参数,以优化特征降维的性能,具体的,参数的更新使用基于梯度下降的优化算法:
88、
89、;
90、其中,是学习率;
91、输出降维数据:最终输出的低维数据用于后续的分类器训练步骤。
92、进一步地,所述训练分类器包括,基于分支界限法的随机森林算法,基于分支界限法的随机森林算法的训练流程如下:
93、特征选择:从降维特征中选择对分类最有影响的特征,具体的,在构建每棵决策树时,对于每个节点,选择最优分割特征和分割点,通过最大化信息增益实现,可以表示为:
94、
95、所述信息增益是根据分割点将数据集分为两部分(左子集和右子集)后不纯度的减少量,不纯度通常使用基尼不纯度或信息熵来计算,以基尼不纯度为例,对于给定的特征和分割点,基尼不纯度可以表示为:
96、
97、其中,是数据集中第类样本的比例,类似的,左右子节点的基尼不纯度和也以同样的方式计算;
98、构建决策树:利用分支界限法在每个决策树的每个节点选择最优分割特征和分割点,具体的,利用分支界限法进行最优分割点搜索的方式可以表示为:
99、
100、其中,搜索空间由特征的所有可能值和潜在的分割点构成;
101、其中,是父节点的不纯度,和是分割后左右子节点的样本数,和是子节点的不纯度;
102、所述分支界限法通过逐步淘汰不可能成为最优解的候选分割点来缩小搜索范围;
103、随机森林训练:构建多个决策树,形成随机森林,每棵树都在特征的一个随机子集上进行训练;
104、集成学习:通过对所有决策树的预测结果进行汇总,汇总的方式为选择最多数的投票得出最终的分类结果,具体的,随机森林由多棵这样的决策树构成,对于一个新的样本,随机森林的预测结果由所有决策树的预测结果的多数投票决定,可以表示为:
105、
106、;
107、其中,是决策树的数量;
108、所述树的数量和树的最大深度是通过人为预设的方式来确定,一般而言,较多的树会提高模型的稳定性和准确性,但同时也会增加计算量;
109、模型优化与评估:通过调整超参数(如树的数量和每棵树的最大深度)来优化随机森林的性能,对于每一组参数,计算交叉验证的准确率的方式可以表示为:
110、
111、其中,是交叉验证的折数,通常设置为5或10;
112、输出分类结果:最终的分类器能够准确地预测新样本的病虫害类别。
113、本发明具有以下有益效果:
114、(1)本发明提供的一种基于人工智能的农作物病虫害预测方法,可以直接应用于农业生产领域,帮助农民更准确地识别和预测病虫害,从而采取更有效的管理和治疗措施,不仅提高了作物产量和质量,还有助于减少农药的滥用,推动农业可持续发展。
115、(2)本发明可以作为农业咨询服务的一部分,提供给农民和农业企业,帮助他们进行科学种植和管理。如,通过提供个性化的病虫害预测服务,帮助农户做出更好的种植决策。
116、(3)本发明技术可以集成到现有的农业信息管理系统中,提供实时的病虫害监测和预测功能,增强这些系统的功能性和实用性。
相关知识
一种基于大数据的多元农作物病虫害监测预警方法与流程
一种基于模型融合的农作物病虫害指标预测方法及装置
一种基于大数据的农作物病虫害诊断系统与方法与流程
一种基于种植设备的病虫害预测方法及装置与流程
一种基于模型融合的农作物病虫害指标预测方法及装置.pdf
基于性能改善深度信念网络的棉花病虫害预测方法
一种基于AI的无人值守农作物病虫害监测预警系统
病虫害识别防治预警系统及方法与流程
人工智能如何助力病虫害预测预报?
大数据驱动下的农作物病虫害预测模型.docx
网址: 一种基于人工智能的农作物病虫害预测方法与流程 https://m.huajiangbk.com/newsview402390.html
上一篇: 小丽花的病虫害防治方法 |
下一篇: 白掌盆栽 |