首页 > 分享 > 基于电子病历的作物病害诊断方法及系统

基于电子病历的作物病害诊断方法及系统

基于电子病历的作物病害诊断方法及系统

1.本发明涉及人工智能技术领域,尤其涉及一种基于电子病历的作物病害诊断方法及系统。

背景技术:

2.病害的及时和专业的诊断,是保障作物生产的重要环节。生产中最基本的诊断方法包括人工可见诊断和生物分子方法,要求诊断者具有植物表型学、植物病理学或生物分子学方面的专业知识。而普通农业生产者,尤其是农户往往不具备这样的专业背景,并且具有专业病害防治知识的专家数量有限,难以覆盖种植分散、数量庞大的农户。
3.因此,具有更低成本、更高准确性的计算机智能辅助诊断方法是帮助农民快速诊断作物病害的重要工具。
4.目前,病害智能诊断方面的研究通常基于光谱、成像、遥感等计算机视觉技术,需要依赖于专业的图像采集设备和拍摄条件,导致对作物的病害诊断成本较高。

技术实现要素:

5.本发明提供一种基于电子病历的作物病害诊断方法及系统,用以解决现有技术中采用计算机视觉技术,需要依赖于专业的图像采集设备和拍摄条件,导致对作物的病害诊断成本较高的缺陷,实现在降低病害诊断成本的同时,对作物病害进行准确诊断。
6.本发明提供一种基于电子病历的作物病害诊断方法,包括:
7.将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;
8.将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;
9.其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。
10.根据本发明提供的一种基于电子病历的作物病害诊断方法,所述将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征,包括:
11.从所述待测作物的电子病历中选择关键特征;
12.其中,所述关键特征包括作物种类、地理位置、发育阶段、发病部位、发病症状、发病时间、发病面积、发病严重程度、田间分布和环境信息;
13.将所述关键特征输入所述语言模型,得到所述语义特征。
14.根据本发明提供的一种基于电子病历的作物病害诊断方法,所述将所述语义特征输入分类模型,得到所述分类模型输出的所述待测作物的病害类别,包括:
15.将所述语义特征输入所述分类模型中的第一特征提取层,得到所述第一特征提取层输出的所述待测作物的电子病历的第一本质特征;
16.将所述第一本质特征与所述语义特征融合后,输入所述分类模型中的第二特征提
取层,得到所述第二特征提取层输出的所述待测作物的电子病历的第二本质特征;
17.将所述第二本质特征输入所述分类模型中的分类层,得到所述分类层输出的所述待测作物的病害类别。
18.根据本发明提供的一种基于电子病历的作物病害诊断方法,在所述将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征之前,还包括:
19.基于作物病害语料库,对所述语言模型进行预训练;
20.基于所述样本作物的电子病历和所述样本作物对应的病害类别,对预训练后的所述语言模型和所述分类模型进行联合训练。
21.根据本发明提供的一种基于电子病历的作物病害诊断方法,所述基于样本作物的电子病历和所述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练,包括:
22.对所述样本作物的电子病历进行预处理;
23.其中,预处理包括缺失值处理、规范化处理、数据去重处理和目标符号删除处理中的一种或多种的组合;
24.基于预处理后的样本作物的电子病历和所述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练。
25.根据本发明提供的一种基于电子病历的作物病害诊断方法,所述分类模型为循环卷积神经网络。
26.本发明还提供一种基于电子病历的作物病害诊断系统,包括:
27.语义特征提取模块,用于:将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;
28.病害诊断模块,用于将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;
29.其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。
30.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于电子病历的作物病害诊断方法的步骤。
31.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于电子病历的作物病害诊断方法的步骤。
32.本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于电子病历的作物病害诊断方法的步骤。
33.本发明提供的基于电子病历的作物病害诊断方法及系统,通过使用语言模型对待测作物的电子病历进行语义特征提取,并将提取的语义特征输入分类模型中,得到待测作物的病害类别,一方面电子病历更易获取且不需要依赖于图像拍摄条件和专业的采集设备,可以有效降低病害诊断的成本;另一方面,电子病历中包含与病害相关的丰富特征,且通过语义特征也可以从电子病历中深度挖掘和提取与病害诊断相关的本质特征,有效提高病害诊断的精度。
附图说明
34.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1是本发明提供的基于电子病历的作物病害诊断方法的流程示意图之一;
36.图2是本发明提供的基于电子病历的作物病害诊断方法中语言诊断模型和分类模型的结构示意图;
37.图3是本发明提供的基于电子病历的作物病害诊断方法的流程示意图之二;
38.图4是本发明提供的基于电子病历的作物病害诊断方法的流程示意图之三;
39.图5是本发明提供的基于电子病历的作物病害诊断方法的流程示意图之四;
40.图6是本发明提供的基于电子病历的作物病害诊断方法的流程示意图之五;
41.图7是本发明提供的基于电子病历的作物病害诊断系统的结构示意图之一;
42.图8是本发明提供的基于电子病历的作物病害诊断系统的结构示意图之二;
43.图9是本发明提供的电子设备的结构示意图。
具体实施方式
44.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.下面结合图1描述本发明的基于电子病历的作物病害诊断方法,该方法包括:步骤101,将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;
46.其中,本实施例中的病害诊断方法可应用于不同的系统或设备,如执行器;执行器可以是智能终端,如手机终端、平板电脑、笔记本电脑和车载终端等,还可以是服务器或云端等,本实施例对此不作具体地限定。
47.待测作物为待进行病害诊断的作物,可以是番茄、黄瓜、草莓、西瓜、白菜和辣椒等,本实施例对此不作具体地限定。
48.需要说明的是,待测作物的电子病历可以是实时录入的电子病历,也可以是预先存储的电子病历。本实施例不对待测作物的电子病历的来源作具体限定。
49.随着医疗管理信息系统在作物病害防治机构的应用,植物医生们的医疗活动通过作物电子病历的形式被记录下来。作物电子病历中记录了大量关于病害症状、药物处方以及环境特征的信息,且获取方便,在辅助病害诊断方面具有巨大价值。
50.其中,作物emr(electronic medical record,电子病历)是指在作物病害防治机构的管理系统中储存的植物医生们的医疗活动的记录。作为最重要的临床数据类型,电子病历以结构化的形式记录了大量关于病害症状、农药处方、统计数据,以及环境特征等多种与病害相关的信息。
51.其中,语言模型可以从待测作物的电子病历中学习获取待测作物的电子病历的语
义特征。
52.可选地,首先利用样本作物的电子病历和所述样本作物对应的病害类别对语言模型和分类模型进行训练,获取最优的语言模型和分类模型;
53.然后,在获取到待测作物的电子病历后,可以直接将待测作物的电子病历输入语言模型中,获取待测作物的电子病历的语义特征;也可以对待测作物的电子病历进行一种或多种处理,如对待测作物的电子病历进行数据清洗和/或特征提取等;然后,再将处理后的待测作物的电子病历输入语言模型中,获取待测作物的电子病历的语义特征;本实施例对此不作具体地限定。
54.步骤102,将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;
55.其中,分类模型可以是卷积神经网络、循环神经网络或卷积神经网络和循环神经网络的组合等,本实施例对此不作具体地限定。
56.其中,病害类别的数量可以根据实际需求进行设置,如32种。
57.可选地,在获取到语义特征后,采用分类模型对语义特征进行学习后,输出待测作物的病害类别;
58.可选地,首先,将语义特征输入分类模型中,得到待测作物对应的病害属于每一预设病害类别的概率;
59.然后,将待测作物对应的病害属于每一预设病害类别的概率分别与预设值进行比较,确定待测作物对应的病害属于每一预设病害类别的概率是否大于预设值;
60.然后,将概率大于预设值的预设病害类别作为目标类别;在目标类别的数量为一个时,直接将目标类别作为待测作物的病害类别;在目标类别的数量为多个时,将概率最大的目标类别作为待测作物的病害类别。
61.相比于基于光谱、成像、以及遥感等计算机视觉的作物病害诊断技术,本实施例将待测作物的电子病历输入语言模型和分类模型中,获取待测作物的病害类别,一方面作物电子病历数据更易获取且不需要依赖于图像拍摄条件和专业的采集设备。另一方面作物电子病历中包含丰富的数据信息,如环境信息,其对于病原侵染过程的重要影响得到了越来越广泛的证明,使得获取的待测作物的病害类别更加准确。
62.本实施例通过使用语言模型对待测作物的电子病历进行语义特征提取,并将提取的语义特征输入分类模型中,得到待测作物的病害类别,一方面电子病历更易获取且不需要依赖于图像拍摄条件和专业的采集设备,可以有效降低病害诊断的成本,另一方面,电子病历中包含与病害相关的丰富特征,且通过语义特征也可以从电子病历中深度挖掘和提取与病害诊断相关的本质特征,有效提高病害诊断的精度。
63.在上述实施例的基础上,本实施例中将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征,包括:从所述待测作物的电子病历中选择关键特征;其中,所述关键特征包括作物种类、地理位置、发育阶段、受害部位、发病症状、发病时间、发病面积、发病严重程度、田间分布和环境信息;将所述关键特征输入所述语言模型,得到所述语义特征。
64.可选地,由于待测作物的电子病历中不仅包含大量与作物病害相关的信息,还包含一些与作物病害无关的信息,如记录时间、记录地点和记录人员个人信息等;
65.为了消除无关信息对病害诊断造成的干扰,本实施例在将待测作物的电子病历输入语言模型之前,从待测作物的电子病历中选择关键特征,再将选择的关键特征依次输入语言模型和分类模型,得到待测作物的病害类别。
66.可选地,可以基于植物病三角原理,从待测作物的电子病历中选择关键特征。
67.其中,植物病理学中的病三角原理给出了由病原体,宿主和环境组成的三角框架。病原体是传染源,其主要类型有病毒,细菌,真菌和线虫等,特定的病原体导致不同的病害症状。宿主的状态也会影响病害感染。作物在不同生长期有着不同的抗病能力,同时,作物的不同部位在感染时表现的症状也不同。例如,番茄苗期常见病为番茄溃疡病,开花期常见病为番茄立枯病。此外,环境是在已有的作物病害智能诊断中最常被忽略的因素。作物生长的不同地区具有独特的水源和土壤环境,种植的不同季节会带来温度、湿度的差异,这些差异影响着病原体的侵害过程以及最终的症状表现。
68.其中,关键特征包括作物种类、地理位置、发育阶段、发病部位、发病症状、发病时间、发病面积、发病严重程度、田间分布和环境信息;
69.需要说明的是,本实施例中的关键特征不局限于上述几种特征,也可以采用其他可表征病害诊断相关的特征,如作为补充说明的问诊记录。
70.其中,作物种类为作物的品种,如作物种类分为番茄、黄瓜、草莓、大白菜、生菜和西瓜等;
71.发育阶段为作物的发育情况,包括苗期、生长期、开花期、成熟期、结果期和收获期;
72.发病部位包括茎基部、茎、叶片、花、果实或谷粒、嫩芽、根、嫩枝或树枝、整株植物等;
73.发病症状包括矮化、花叶、表面生长、畸形、蛀洞(茎/果实)、发现昆虫、螨、腐烂、干枯、黄化、梢枯、叶斑、叶烧、着色、颜色异常、小叶、落果、溃疡(茎部损伤)、瘿瘤、膨大和丛枝等。
74.本实施例通过从待测作物的电子病历中选择丰富的与病害相关的关键特征,并利用关键特征对待测作物的病害类别进行诊断,可使病害诊断结果更加准确,并可为农户或植物医生进行病害诊治提供更加有效的辅助信息。
75.在上述实施例的基础上,本实施例中所述将所述语义特征输入分类模型,得到所述分类模型输出的所述待测作物的病害类别,包括:将所述语义特征输入所述分类模型中的第一特征提取层,得到所述第一特征提取层输出的所述待测作物的电子病历的第一本质特征;将所述第一本质特征与所述语义特征融合后,输入所述分类模型中的第二特征提取层,得到所述第二特征提取层输出的所述待测作物的电子病历的第二本质特征;将所述第二本质特征输入所述分类模型中的分类层,得到所述分类层输出的所述待测作物的病害类别。
76.其中,分类模型可以是双向lstm(long short-term memory,长短期记忆网络)结构,包括第一特征提取层、第二特征提取层和分类层;
77.其中,第一特征提取层和第二特征提取层的维度和层数可以根据实际需求进行设置,如第一特征提取层的维度为256维;
78.其中,为了防止分类模型训练的过拟合,可以在第一特征提取层和/或第二特征提
取层增加dropout层。
79.可选地,可以将语义特征输入分类模型中的第一特征提取层,对语义特征进行学习,获取与病害诊断相关的特征,以得到待测作物的电子病历的第一本质特征;
80.然后,将第一特征提取层输出的第一本质特征与语言模型输出的语义特征进行拼接融合后,进行非线性激活;其中,非线性激活可以是tanh非线性激活等,本实施例对此不作具体地限定。
81.然后,采用第二特征提取层的池化层从融合特征中进一筛选出第二本质特征;其中,池化层可以是最大池化层等,本实施例对此不作具体地限定。
82.最后,将第二本质特征输入分类模型中的分类层,得到分类层输出的所述待测作物的病害类别。其中,分类层为全连接层,采用softmax函数激活函数,可对多种病害类别进行诊断,如32种。
83.本实施例通过对分类模型对语义特征进行多尺度特征提取,使得提取的第二本质特征中包含更加准确和丰富的与病害类别相关的特征,进而有效提高病害的诊断精度。
84.在上述各实施例的基础上,本实施中在所述将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征之前,还包括:基于作物病害语料库,对所述语言模型进行预训练;基于所述样本作物的电子病历和所述样本作物对应的病害类别,对预训练后的所述语言模型和所述分类模型进行联合训练。
85.其中,语言模型可以是bert(bidirectional encoder representations from transformers,基于转换器的双向编码表征)语言模型等其他语言模型,本实施例对此不作具体地限定。
86.如图2所示,bert语言模型采用token、segmentation和position三种嵌入进行叠加作为所述bert语言模型的输入,通过字符级bert语言模型进行电子病历的作物文本表示。
87.bert语言模型可以是google(谷歌)发布的中文bert模型“bert-base-chinese”,该模型的主要参数包括:12层transformer模型,输出大小为768维向量,注意力头为12个,总参数大小为110mb。共包含约20000个简体和繁体汉字,以及一些英文单词和数字。“bert-base-chinese”模型的通用语料库主要来源于中文维基百科(wikipedia);即“bert-base-chinese”模型是在中文维基百科(wikipedia)语料上预训练获取的语言模型。
88.其中,wikipedia语料是具有多样性的大型通用领域语料库。但是作物病害诊断模型需要对与作物病害相关的语料进行诊断,而作物病害相关的语料数据来自于不同的分布。电子病历的作物数据具有农业领域的语言特征,且农业生产用语中又常包含大量方言和俚语。因此,要准确提取电子病历的作物语义特征,bert语言模型需要通过领域自适应预训练适应与作物病害相关的语料数据的异质性。
89.可选地,在将待测作物的电子病历输入语言模型,得到语言模型输出的待测作物的语义特征之前,需要对语言模型和分类模型进行训练,以获取最优的语言模型和分类模型;其中,对语言模型进行训练的步骤包括,
90.首先,为了使bert语言模型适应作物病害语料数据的异质性,需要构建作物病害语料库;其中,作物病害语料库可以由北京市植保站提供的全部电子病历、病虫害“明白纸”和农业信息网上的病害介绍文本构建形成。
91.需要说明的是,作物病害语料库可以使用有标签数据或者无标签数据,本实例对此不作具体地限定;并且在构建作物病害语料库之前,需要对电子病历进行文本清洗处理。文本清洗处理包括但不限于文本规范化、去除无意义字符或去除停用词等,本实施例对此不作具体地限定。
92.然后,基于中文bert预训练模型,以mlm(masked language model,掩码语言模型)和nsp(next sentence prediction,预测下一句)作为预训练目标,在作物病害语料库对bert语言模型进行dapt(domain adaptation,领域自适应)预训练,以在与作物病害语料库一致的向量空间中获得电子病历的作物语义特征。
93.其中,mlm随机掩盖了输入序列中15%的词,然后学习通过上下文的词来预测这些被掩盖的词,从而训练bert语言模型的双向transfomer编码器。
94.nsp学习用于确定两个句子是否有上下文。nsp随机地将数据分成两个同等大小的部分,其中一部分数据中的两对语句是上下文连续的,被用作正面例子,另一部分数据中的两对语句是上下文不连续的,被用作负面例子,然后transformer模型学习判断这两个句子是否有上下文关系。
95.然后,再将样本作物的电子病历依次输入预训练后的语言模型和分类模型,得到样本作物的预测病害类别;根据样本作物的预测病害类别和真实病害类别标签之间的偏差,采用梯度下降法对预训练后的语言模型和分类模型进行联合训练,以获取最优的语言模型和分类模型。
96.可选地,对预训练后的语言模型和分类模型进行联合训练的步骤包括,首先,构建样本数据集;样本数据集以选择的多种作物种类的样本作物的电子病历作为样本,以多种病害类别作为标签;
97.例如,选择番茄、黄瓜、草莓、西瓜、白菜和辣椒6种主要种植作物的32种常见病害构建样本数据集;
98.然后,通过分层抽样的方式从样本数据集中选择80%的数据集作为训练集,对预训练后的语言模型和分类模型进行联合训练;选择20%的数据集作为测试集,对联合训练后的语言模型和分类模型进行性能测试。
99.其中,通过分层抽样可以保证训练集和测试集的分布与原始样本数据集的分布一致。
100.本实例充分考虑作物电子病历文本数据的数据量少和专业性强的特点,通过作物病害语料库,对语言模型进行领域自适应预训练,可以从海量的通用领域语料中学习到通用的语言表示,并从电子病历的作物专业领域语料学习语义特征,以适应作物病害领域的异质性;并以不同种类作物的不同病害类别的电子病历作为语言模型和分类模型的输入,对语言模型和分类模型进行联合训练和测试,能够有效提高作物病害诊断的准确性和自动化程度,降低作物病害诊断的应用成本和复杂程度,以实现高效便捷的自动化诊断,并辅助农户或植物医生进行病害诊治的决策,缓解农户数量多、专业植物医生数量不足的问题。
101.在上述实施例的基础上,本实施中所述基于样本作物的电子病历和所述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练,包括:对所述样本作物的电子病历进行预处理;其中,预处理包括缺失值处理、规范化处理、数据去重处理和目标符号删除处理中的一种或多种的组合;基于预处理后的样本作物的电子病历和所
述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练。
102.可选地,由于记录误差或人为因素等都会造成采集的样本作物的电子病历存在数据缺失或者数据异常的情况。所以,在采用将样本作物的电子病历对语言模型和分类模型进行联合训练之前,需要对样本作物的电子病历进行预处理,以加快语言模型和分类模型的训练效率以及模型的性能。
103.其中,预处理包括缺失值处理、规范化处理、数据去重处理和目标符号删除处理中的一种或多种的组合。
104.例如,对样本作物的电子病历进行预处理,利用停用词库删除样本作物的电子病历中的特殊符号和其它指定无意义的字符和表情符等;和/或,对样本作物的电子病历中的缺失值采用丢弃处理;和/或,对样本作物的电子病历进行规范化处理,如对表示时间的数值型数据进行统一格式的规范等;和/或,对样本作物的电子病历进行数据去重处理。
105.在上述实施例的基础上,本实施例中所述分类模型为循环卷积神经网络。
106.其中,循环卷积神经网络采用双向的循环网络结构,替代传统基于窗口的神经网络,使分类模型在学习作物电子病历文本表示时可以保留更大范围的词序,并结合了卷积神经网络的最大池化层,利用了循环神经模型和卷积神经模型的优点,使得病害分类结果更加准确。
107.如图3所示,为基于电子病历的作物病害诊断方法的完整流程图,主要步骤包括:
108.步骤301,获取样本作物的电子病历并进行预处理,以及对样本作物的电子病历进行关键特征选择,构建样本数据集;
109.步骤302,采用作物病害语料库,对语言模型进行领域自适应预训练;
110.步骤303,采用样本数据集对预训练的语言模型和分类模型进行训练;
111.步骤304,对于待测作物的电子病历,利用训练好的语言模型和分类模型,获取待测作物的病害类别。
112.如图4所示,步骤301构建样本数据集的具体步骤包括:
113.步骤401,根据植物病三角原理,选择样本作物的电子病历中的关键特征;
114.步骤402,通过缺失值处理、规范化处理、数据去重处理和目标符号删除处理中的一种或多种的组合预处理,对样本作物的电子病历进行数据处理;
115.步骤403,分层抽样选择80%的样本作为样本数据集的训练集,20%的样本作为样本数据集的测试集。
116.如图5所示,步骤302对语言模型进行领域自适应预训练的具体步骤包括:
117.步骤501,采用北京市植保站提供的全部电子病历、病虫害“明白纸”和农业信息网上的病害介绍文本构建形成作物病害语料库;
118.步骤502,基于掩码语言模型和预测下一句作为预训练目标,在作物病害语料库对bert语言模型进行领域自适应预训练。
119.如图6所示,步骤303对预训练的语言模型和分类模型进行训练的具体步骤包括:
120.步骤601,采用预训练的bert语言模型提取样本作物的语义特征,以其输出的768维向量作为分类模型的特征提取层的输入;
121.步骤602,将语义特征输入第一特征提取层,并将第一特征提取层输出的第一本质特征与bert语言模型输出的语义特征进行拼接并进行tanh非线性激活,用最大池化层来筛
选第二本质特征,增加dropout层防止过拟合,将第二本质特征输入分类层,对样本作物的病害类别进行预测;根据预测病害类别和真实病害类别对bert语言模型和分类模型进行优化训练。
122.下面对本发明提供的基于电子病历的作物病害诊断系统进行描述,下文描述的基于电子病历的作物病害诊断系统与上文描述的基于电子病历的作物病害诊断方法可相互对应参照。
123.如图7所示,本实施例提供一种基于电子病历的作物病害诊断系统,该系统包括语义特征提取模块701和病害诊断模块702;
124.语义特征提取模块701将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;
125.其中,本实施例中的病害诊断方法可应用于不同的系统或设备,如执行器;执行器可以是智能终端,如手机终端、平板电脑、笔记本电脑和车载终端等,还可以是服务器或云端等,本实施例对此不作具体地限定。
126.待测作物为待进行病害诊断的作物,可以是番茄、黄瓜、草莓、西瓜、白菜和辣椒等,本实施例对此不作具体地限定。
127.需要说明的是,待测作物的电子病历可以实时录入的电子病历,也可以是预先存储的电子病历。本实施例不对待测作物的电子病历的来源作具体限定。
128.随着医疗管理信息系统在作物病害防治机构的应用,植物医生们的医疗活动通过电子病历的作物形式被记录下来。作物电子病历中记录了大量关于病害症状、药物处方以及环境特征的信息,且获取方便,在辅助病害诊断方面具有巨大价值。
129.其中,作物emr是指在作物病害防治机构的管理系统中储存的植物医生们的医疗活动的记录。作为最重要的临床数据类型,电子病历以结构化的形式记录了大量关于病害症状、农药处方、统计数据,以及环境特征等多种与病害相关的信息。
130.其中,语言模型可以从待测作物的电子病历中学习获取待测作物的电子病历的语义特征。
131.可选地,首先利用样本作物的电子病历和所述样本作物对应的病害类别对语言模型和分类模型进行训练,获取最优的语言模型和分类模型;
132.然后,在获取到待测作物的电子病历后,可以直接将待测作物的电子病历输入语言模型中,获取待测作物的电子病历的语义特征;也可以对待测作物的电子病历进行一种或多种处理,如对待测作物的电子病历进行数据清洗和/或特征提取等;然后,再将处理后的待测作物的电子病历输入语言模型中,获取待测作物的电子病历的语义特征;本实施例对此不作具体地限定。
133.病害诊断模块702用于将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;
134.其中,分类模型可以是卷积神经网络、循环神经网络或卷积神经网络和循环神经网络的组合等,本实施例对此不作具体地限定。
135.其中,病害类别的数量可以根据实际需求进行设置,如32种。
136.可选地,在获取到语义特征后,采用分类模型对语义特征进行学习后,输出待测作物的病害类别;
137.可选地,首先,将语义特征输入分类模型中,得到待测作物对应的病害属于每一预设病害类别的概率;
138.然后,将待测作物对应的病害属于每一预设病害类别的概率分别与预设值进行比较,确定待测作物对应的病害属于每一预设病害类别的概率是否大于预设值;
139.然后,将概率大于预设值的预设病害类别作为目标类别;在目标类别的数量为一个时,直接将目标类别作为待测作物的病害类别;在目标类别的数量为多个时,将概率最大的目标类别作为待测作物的病害类别。
140.相比于基于光谱、成像、以及遥感等计算机视觉的作物病害诊断技术,本实施例将待测作物的电子病历输入语言模型和分类模型中,获取待测作物的病害类别,一方面作物电子病历数据更易获取且不需要依赖于图像拍摄条件和专业的采集设备。另一方面作物电子病历中包含丰富的数据信息,如环境信息,其对于病原侵染过程的重要影响得到了越来越广泛的证明,使得获取的待测作物的病害类别更加准确。
141.本实施例通过使用语言模型对待测作物的电子病历进行语义特征提取,并将提取的语义特征输入分类模型中,得到待测作物的病害类别,一方面电子病历更易获取且不需要依赖于图像拍摄条件和专业的采集设备,可以有效降低病害诊断的成本,另一方面,电子病历中包含与病害相关的丰富特征,且通过语义特征也可以从电子病历中深度挖掘和提取与病害诊断相关的本质特征,有效提高病害诊断的精度。
142.如图8所示,在上述实施例的基础上,本实施例中还包括关键特征提取模块,用于:从所述待测作物的电子病历中选择关键特征;其中,所述关键特征包括作物种类、地理位置、发育阶段、受害部位、发病症状、发病时间、发病面积、发病严重程度、田间分布和环境信息;将所述关键特征输入所述语言模型,得到所述语义特征。
143.在上述实施例的基础上,本实施例中病害诊断模块,具体用于:将所述语义特征输入所述分类模型中的第一特征提取层,得到所述特征提取层输出的所述待测作物的电子病历的第一本质特征;将所述第一本质特征与所述语义特征融合后,输入所述分类模型中的第二特征提取层,得到所述特征提取层输出的所述待测作物的电子病历的第二本质特征;将所述第二本质特征输入所述分类模型中的分类层,得到所述分类层输出的所述待测作物的病害类别。
144.在上述各实施例的基础上,本实施例中还包括训练模块,用于:基于作物病害语料库,对所述语言模型进行预训练;基于样本作物的电子病历和所述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练。
145.在上述实施例的基础上,本实施例中还包括数据预处理模块,用于:所述基于样本作物的电子病历和所述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练,包括:对所述样本作物的电子病历进行预处理;其中,预处理包括缺失值处理、规范化处理、数据去重处理和目标符号删除处理中的一种或多种的组合;基于预处理后的样本作物的电子病历和所述样本作物对应的病害类别,对所述预训练后的语言模型和所述分类模型进行联合训练。
146.在上述各实施例的基础上,本实施例中所述分类模型为循环卷积神经网络。
147.图9示例了一种电子设备的实体结构示意图,如图9所示,该电子设备可以包括:处理器(processor)901、通信接口(communications interface)902、存储器(memory)903和
通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信。处理器901可以调用存储器903中的逻辑指令,以执行基于电子病历的作物病害诊断方法,该方法包括:将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。
148.此外,上述的存储器903中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
149.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的基于电子病历的作物病害诊断方法,该方法包括:将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。
150.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的基于电子病历的作物病害诊断方法,该方法包括:将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。
151.以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
152.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
153.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管
参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

 

技术特征:
1.一种基于电子病历的作物病害诊断方法,其特征在于,包括:将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;将所述语义特征输入分类模型,得到所述分类模型输出的所述待测作物的病害类别;其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。2.根据权利要求1所述的基于电子病历的作物病害诊断方法,其特征在于,所述将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征,包括:从所述待测作物的电子病历中选择关键特征;其中,所述关键特征包括作物种类、地理位置、发育阶段、发病部位、发病症状、发病时间、发病面积、发病严重程度、田间分布和环境信息;将所述关键特征输入所述语言模型,得到所述语义特征。3.根据权利要求1所述的基于电子病历的作物病害诊断方法,其特征在于,所述将所述语义特征输入分类模型,得到所述分类模型输出的所述待测作物的病害类别,包括:将所述语义特征输入所述分类模型中的第一特征提取层,得到所述第一特征提取层输出的所述待测作物的电子病历的第一本质特征;将所述第一本质特征与所述语义特征融合后,输入所述分类模型中的第二特征提取层,得到所述第二特征提取层输出的所述待测作物的电子病历的第二本质特征;将所述第二本质特征输入所述分类模型中的分类层,得到所述分类层输出的所述待测作物的病害类别。4.根据权利要求1-3任一所述的基于电子病历的作物病害诊断方法,其特征在于,在所述将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征之前,还包括:基于作物病害语料库,对所述语言模型进行预训练;基于所述样本作物的电子病历和所述样本作物对应的病害类别,对预训练后的所述语言模型和所述分类模型进行联合训练。5.根据权利要求4所述的基于电子病历的作物病害诊断方法,其特征在于,所述基于所述样本作物的电子病历和所述样本作物对应的病害类别,对预训练后的所述语言模型和所述分类模型进行联合训练,包括:对所述样本作物的电子病历进行预处理;其中,预处理包括缺失值处理、规范化处理、数据去重处理和目标符号删除处理中的一种或多种的组合;基于预处理后的样本作物的电子病历和所述样本作物对应的病害类别,对预训练后的所述语言模型和所述分类模型进行联合训练。6.根据权利要求1-3任一所述的基于电子病历的作物病害诊断方法,其特征在于,所述分类模型为循环卷积神经网络。7.一种基于电子病历的作物病害诊断系统,其特征在于,包括:语义特征提取模块,用于将待测作物的电子病历输入语言模型,得到所述语言模型输
出的所述待测作物的电子病历的语义特征;病害诊断模块,用于将所述语义特征输入分类模型,得到所述分类模型输出的所述待测作物的病害类别;其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于电子病历的作物病害诊断方法的步骤。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于电子病历的作物病害诊断方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述基于电子病历的作物病害诊断方法的步骤。

技术总结
本发明提供一种基于电子病历的作物病害诊断方法及系统,该方法包括:将待测作物的电子病历输入语言模型,得到所述语言模型输出的所述待测作物的电子病历的语义特征;将所述语义特征输入分类模型,得到所述分类模型输出的待测作物的病害类别;其中,所述语言模型和所述分类模型根据样本作物的电子病历和所述样本作物对应的病害类别训练获取。本发明一方面实现电子病历更易获取且不需要依赖于图像拍摄条件和专业的采集设备,可以有效降低病害诊断的成本;另一方面,电子病历中包含与病害相关的丰富特征,且通过语义特征也可以从电子病历中深度挖掘和提取与病害诊断相关的本质特征,有效提高病害诊断的精度。有效提高病害诊断的精度。有效提高病害诊断的精度。

技术研发人员:张领先 丁俊琦 徐畅 李凯雨 朱昕怡
受保护的技术使用者:中国农业大学
技术研发日:2021.12.17
技术公布日:2022/4/8

相关知识

基于电子病历的作物病虫害关联挖掘及智能诊断
基于卷积神经网络的皮肤病诊断系统研究
Science文章提议:建立作物病害全球监测系统
智能诊断系统会“读”病历了
作物病害检测app下载
温室植物病害的图像处理及特征值提取方法的研究(一)——基于图像预处理的特征值提取方法的研究
中国科学院机构知识库网格系统: 基于深度学习的苹果花果信息感知与病虫害诊断技术研究
基于递归神经网络算法的电子物流配送系统配送路径优化
大田作物病虫害诊断及防治方法.docx
基于循证医学与真实病历库的CDSS实现与应用

网址: 基于电子病历的作物病害诊断方法及系统 https://m.huajiangbk.com/newsview343967.html

所属分类:花卉
上一篇: 植株病虫害快速诊断仪器 THP
下一篇: 一种基于大数据的农作物病虫害诊断