首页 > 分享 > 预警系统中的智能方法综述

预警系统中的智能方法综述

1.   引言

预警系统[1]是一种在危险发生之前,根据以往规律和当前观测识别异常,进而发出警示信号的系统。一个良好的预警系统既可以帮助消息接收者及时应对危险从而规避伤害,也可以帮助系统构建者及时发现异常从而消除危险。当下,预警系统广泛应用于各个领域,如自然灾害预警、金融风险预警、网络安全预警、交通安全预警等,实现了巨大的经济效益和社会效益。

在传统预警系统中,专家通过自身的经验和直觉对警情进行分析和判断。然而,他们难以及时处理大量信息并作出决策,且作出的决策比较主观。决策的滞后性和主观性使得预警的有效性难以得到保证。为了实现自动预警,部分研究者试图根据警兆和警情的逻辑关系建立物理模型来实现预警。建立精确的物理模型、筛选恰当的指标以及确定合适的指标权重需要对预警场景有深入的理解,不同专家的理解不同,因此在建立模型、确定指标以及各指标权重时会带来一定的主观性。在复杂场景中,模型、指标以及各指标权重的确定很困难,依赖物理模型的方法效率低下。借助数理统计技术,如相关性分析、假设检验等,可以从一定程度上缓解上述方案主观、低效的问题,然而统计方法需要对数据的分布等作出假设,在复杂场景中,这些假设很难贴合实际,会影响预警性能。

近年来,随着人工智能技术的快速发展,越来越多的人工智能方法被应用到了预警系统中。这些方法在减少人力的同时提升了预警性能。本文重点关注了机器学习、专家系统以及多源信息融合技术在预警系统中的应用。机器学习是一种从数据中自动提取特征、总结规律,并利用这些规律进行决策的技术。专家系统是一种基于知识表示和推理的人工智能应用程序,其模拟了专家根据知识进行决策的过程。相较于数据依赖的机器学习方法,专家系统侧重于领域知识的构建,能解决数据不确定和决策逻辑复杂的问题。多源信息融合技术是一种自动整合不同信息源的技术,由于考虑了更全面的信息,预警系统可以作出更准确、可靠的结论。智能方法可以克服传统预警系统的弊端,越来越多的工作专注于研究预警系统中的智能方法。

本文将对预警系统中的智能方法进行介绍,结构安排如下:第2节首先介绍传统预警系统,第3节重点讲述基于机器学习的预警系统,第4节着重介绍基于专家系统的预警系统,第5节阐述基于多源信息融合技术的预警系统,第6节对本文内容进行了总结与展望。

2.   传统预警系统

本节介绍传统预警系统。在早期的山洪预警中,专家根据降雨量和水位的实时监测值分析警情,进而作出决策。为了实现自动预警,文献[2]根据降雨特性、地表特征和居民分布等因素设计了动态预警指数,并采用水位流量模型计算出了每个时期的最大降雨量,随后通过比较最大降雨量和预警指数来决定是否发出预警信号。在文献[3]中,研究人员根据不同地域气候、地形的特性设计水文模型和监测指标,并根据水文模型和监测指标模拟山洪的演进过程,随后将模拟流量和设定阈值相比较来实现山洪预警。该模型受参数影响大,需要专家对该流域水文过程的物理机制有较深的理解。在政治危机预警中,一些专家直接通过人工分析来预测政治危机,另外一些专家基于各自的理解设计了预警模型来自动地预测政治危机[4-5]。例如宏观结构预测模型通过预测政治、社会、经济、人口的发展趋势来对国家的不稳定趋势进行预警,另外一些研究者在模型中加入领导人、各组织、各国之间互动事件的发生频率和事件性质来帮助预测局势动荡程度,还有一些研究者将领导人的个性、领导风格等因素加入预警模型。可见,不同专家的政治见解不同,建立的模型也不同,这样的设计方法具有较强的主观性。在山体滑坡预警中,文献[6]研究了从1977年到2019年应用于全球13个地区的山体滑坡预警系统,其假设降雨是滑坡的主要或唯一触发因素,并根据不同地区的地理、气候特点设计了不同的基于降雨量的预警模型,使用的降雨量指标包括累积降雨量、降雨持续时间、土壤湿度等。不同的预警系统根据所设指标和专家知识设计了经验阈值来划分警情警度。这样的模型具有一定的科学性,但因为不同地区的环境和气候差距很大,模型不具备通用性,且监测指标和阈值的确定具有较强的主观性。在财务危机预警中,常用的预警方法包括历史经验法和实证法。历史经验法是根据企业历史经验来确定预警信号,随后实施预警,预警信号包括销售的非预期下降、管理层大量抛售本公司股票、统计数据过缓等。历史经验法的通用性强,对任何企业都适用,但是缺乏理论支持,且在财务指标、指标权重的选取上具有主观性。在实证法中,研究人员先建立一个理论模型,如多元判别模型,再找到影响预测性能的关键指标,通过跟踪这些指标来判别财务状况。实证法具有较强的理论性,但通用性较差,实际场景中很难建立起一个对所有公司都适用的理论模型。

可见,传统方法在选择合适的模型、指标以及指标权重方面尤为困难,此外一些模型可能对指标变量有严苛的要求,如多元判别模型中要求选取的变量满足正态分布且两两之间不共线,而在实际场景中,往往具有大量的、错综复杂的指标变量,指标变量常常不满足正态分布,且指标变量之间经常是共线的。此外,模型和模型参数的最优选取会随着场景和时间的变化而变化。由于模型缺乏自我学习和自我更新能力,专家需要不断地调整模型和模型参数,导致预警系统的稳定性和灵活性较差。

为了缓解上述问题,一些预警系统在设计过程中借助了数理统计技术来帮助选取指标和构建模型。在山洪预警中,专家借助数理统计技术设计了CWI(Compound Warning Index)指标,CWI由降雨强度和有效降雨量的乘积构成,是一个基于统计数据得到的、与水文特征无关的指标。文献[7]在突发地质灾害气象预警中,通过卡方检验来判别地质环境因子独立性,从而解决了指标共线的问题,优化了指标的选取。在文献[8]提及的空气压缩机故障预警系统中,使用了滑动窗口统计方法来确定判定系统故障的阈值。文献[9]在电气火灾预警中,基于互信息筛选出了与警情相关性高且独立的变量作为预警指标。在文献[10]中,为了消除冗余变量,使用了Spearman相关系数得到每个自变量的相关性分数,并筛选出了相关性分数高于0.8的变量作为预警指标。文献[11]提供了一个崭新的思考角度:在自然界的复杂系统中普遍会存在某个关键临界点,而这个关键临界点可以由统计分析发现,它的出现意味着出现了系统发生重大转变的前兆。研究人员开始探索有效的警兆指标来监测临界点的出现。例如,在气候急变预警中定义二氧化钙浓度一阶自相关系数为警兆指标,当气候出现从温室向冰室剧变的情况时,警兆指标急剧上涨,此时认为临界点出现。另外一些研究人员发现了其他能够标志临界点出现的现象[12],如DFA指数[13]的剧涨、方差的剧涨以及偏度的剧涨等。在土地荒漠化预警中[14],专家研究发现植被自组织模式的增加是土地贫瘠的征兆,因此量化了植被自组织模式并以此作为警兆指标。在癫痫发作预警中,专家实验发现在癫痫发作的几小时前,大脑常常会出现轻微的能量爆发使得脑电信号的方差增大,因此专家将脑电信号的方差作为了警兆指标。在金融重大事件预警中,研究人员基于隐含波动率设计了VIX指数[15],也称“恐慌指数”,VIX的增加常被认为是金融市场出现重大事件的早期预警现象。

借助数理统计技术可以帮助指标和模型的选取。然而,统计技术常常需要对数据的分布等作一些假设,这些假设常常不贴合实际,可能会造成模型和指标选取不当。例如在文献[16]中提到,并非所有场景在发生重大转变之前都会存在这样一个临界点,在这样的场景下基于临界点的预警模型便不再适用。此外,利用不合适的相关性分析法来筛选指标可能会造成信息的丢失。再者,当自变量维数较高、自变量和因变量常呈现非线性关系时,传统模型很难适用,其展现的性能常常不尽如人意。

3.   基于机器学习方法的预警系统

为了克服传统预警系统的诸多弊端,一些机器学习方法被应用于预警系统,本节重点讲述基于机器学习方法的预警系统。实际场景中,一般能采集到错综复杂的信息,这些信息常常含有大量冗余和噪声。冗余和噪声不利于预警系统的构建,而利用机器学习特征提取算法可以去除这些冗余和噪声。本文首先介绍特征提取算法,良好的特征提取算法能够自动地发现数据本质的结构。除提取特征以外,机器学习还可以帮助构建良好的预警模型。目的不同,选择的模型也不同。系统在正常阶段和异常阶段会表现出不同的状态,异常状态的出现被视为一种危险信号。如果需要根据监测指标来判断当前系统是否出现了异常,那么可以将预警视为分类问题,将机器学习中的分类模型作为预警模型。此时,模型的输入为监测指标,模型的输出为系统在未来某时刻的危险等级。从另一目的看,预警系统需要对正常状态下的指标走势进行预测,这样的问题可视为回归问题。指标在正常模式下可以被预测,在异常状态下难以被预测,因此利用预测偏差便可以度量系统的异常程度。此时,模型的输入为监测指标,模型的输出为系统风险相关指标在未来某时刻的预测值。在介绍特征提取算法后,本节也对基于分类和回归的预警方法进行介绍。

3.1.   特征提取方法

在机器学习算法中,主成分分析[17](Principal Component Analysis,PCA)和因子分析[18](Factor Analysis,FA)是两种经典的无监督的特征提取算法。PCA和FA直接根据数据的内部关系来去除噪声和冗余,从而提取到关键特征,其示意图见图1。另外,在有标签的情况下,也可以使用有监督的特征提取方法,如Lasso回归、神经网络等。假设原始数据为X,特征提取函数为f,则可以根据特征提取函数得到特征z,其形式如下:

图  1  PCA和FA示例

Fig.  1.  Sketches of PCA and FA

本小节将对特征提取方法进行介绍。

PCA可以从大量变量中提取得到几个主成分,这些主成分是原始变量的线性组合。假设有若干样本,每个样本有p个变量,记x1,x2,⋯,xp为原变量,z1,z2,⋯,zm(m≤p)为新的变量,也称主成分,PCA的数学模型可以构建如下:

可见,主成分实际上是各原变量的线性组合。

文献[19]中利用PCA进行财务预警模型,其将上市公司的财务数据作为样本,根据累积贡献率提取了前7个主成分作为关键特征进行后续的分析。文献[20]在超短期强降水预警中使用了PCA算法来对高维的气象数据进行特征提取。文献[21]在跨境资本异常波动的风险预警中结合了Lasso和PCA构建了Lasso-PCA双重筛选模型来得到预警因子,随后利用该预警因子帮助捕捉到不同类型的跨境资本异动行为。

与PCA不同,FA从众多变量内部之间的依赖关系中提取出少量的、不相关的基础因子,它将原始变量拆解成公共因子和特殊因子两部分。假设有若干样本,每个样本有p个变量,记x1,x2,⋯,xp为原变量,f1,f2,⋯,fk(k≤p)为新的变量,也称因子,FA的数学模型可以构建如下:

其中,f1,f2,⋯,fk被称为公共因子,εi被称为特殊因子,各因子的线性组合构成了原始的指标。

文献[22]对30个上市公司财务指标进行了多因子分析,根据方差累积贡献率提取了前5个公共因子来进行作为预警指标。在学业危机预警中,文献[23]利用FA从学科成绩中提取出了11个关键因子作为预警指标。

除了经典机器学习特征提取方法,一些深度神经网络模型也被广泛用于特征提取。通过标签的引导,神经网络可以从大量的数据中自动地提取特征,是一种更加智能的特征提取方法。文献[8]提及的空气压缩机故障预警系统中使用了PCA和神经网络分别进行线性和非线性特征提取,得到具有代表性的若干变量来构建动态记忆矩阵,并通过动态记忆矩阵构建了MSET物理模型以实现预警。文献[24]先是利用经验模态分解提取大气电场的频域特征,随后使用稀疏自编码器对频域特性进行进一步的特征提取,以此得到更好的特征来帮助提升雷电预警性能。在地震预警中,P波常常会与局部的脉冲噪声混淆,从而产生误报,为了避免两者混淆,文献[25]设计了一种基于生成对抗网络(Generative Adversarial Network,GAN)的特征提取器,其利用噪声波和P波来训练GAN,将去掉最后两层的判别器作为特征提取器,该特征提取器能够在特征空间区分P波和噪声波,并借助随机森林分类器完成地震预警任务。在文献[26]中,使用了attention-based Encoder进行时序数据进行特征提取,得到了上下文特征,随后将得到的上下文特征输入到Decoder来输出病情恶化预测结果,该方法在对时序数据编码时使用了attention机制,使得与预测任务更相关的序列趋势受到更多的关注。文献[10]在流化催化裂化预警中,先是利用了Spearman相关系数对指标进行初筛,随后基于变量以及变量之间的关系建立了有向图,这种图表征可以很好地表达变量之间的关系,具有更强的可解释性。得益于图表征所具备的空间结构,文章使用了卷积神经网络来提取深层空间特征,得到的特征被送入神经网络来预测反应温度,在反应温度异常高时发出预警信号,实现了预警任务。文献[27]中提出了一种基于CNN-LSTM的磨煤故障预警方法,其将磨煤机7个测点参数的多元时间序列输入CNN,通过64个卷积核来进行特征提取,得到一段具有时间依赖性的序列,随后序列通过最大池化层和dropout层,并按照时间顺序输入到LSTM神经网络来对指标进行预测。

基于上述内容对机器学习特征提取方法进行了总结,如表1所示。相较于传统的机器学习特征提取算法,神经网络特征提取算法能够更好地应对高维异构数据、捕捉深层特征,具有良好的通用性。现如今越来越多的研究使用神经网络来实现特征提取。

表  1  特征提取方法

Tab.  1.  Feature extraction methods

文献应用场景特征提取方法 [19]财务危机预警PCA[20]超短期强降水预警PCA[21]跨境资本异常波动风险预警Lasso-PCA[22]财务危机预警FA[23]学业危机预警FA[8]空气压缩机故障预警系统PCA+神经网络[24]雷电预警经验模态分解+稀疏自编码器[25]地震预警GAN[26]病情恶化预警Attention-based Encoder[10]流化催化裂化预警CNN[27]磨煤故障预警CNN

3.2.   基于分类的方法

在对原始数据进行特征提取后,就可以将特征送入分类器来完成判别任务。假设由数据X得到的特征为Z,分类器为C,则可由分类器对警报类别进行预测:

其中ˆyc是预测类别。本小节将对基于分类的方法进行介绍。

在金融领域,Logit[28]、Probit等模型被广泛应用于货币危机预警、银行破产危机预警等场景。这些模型不仅被用于危机预警,也常常被用于分析导致危机的关键因素。文献[29]利用了多元Logit模型来对1980年至1994年中的银行破产危机进行研究,从而发现国家的低GDP、高实际利率、高通胀是银行危机的重要前兆。文献[30]借助Logit和Probit模型,用GDP增长率和境外资产来进行货币危机预警。文献[31-32]利用了Probit和Logit回归来对银行危机进行预测和预警。文献[33]提出了一种基于SVM的学业异常预警系统,其利用Kendall相关性分析得到了7个与“顺利毕业”相关的学业指标,利用每个学生前三学年的学业指标和最后一学年的毕业情况来训练SVM分类器,得到的SVM分类器能够对学生的毕业情况进行预测,对预测为不能顺利毕业的学生发出预警信号,从而实现学业预警。在重型败血症预警中,文献[34]设计了随机森林分类器来判断未来1个小时之内是否会出现病情。文献[35]提出了一种用于电力系统的预警模型,称为CMEW-EKNN模型,其从异常检测的角度出发,在人工筛选指标后,利用场景中的大量正常样本来训练模型,通过设定EKNN中的距离拒绝选项来判断新的样本点是否为异常点。为了进一步提升模型的准确性和鲁棒性,作者引入了一个自适应的折扣因子来优化决策边界,最后证明了该模型在多种电力系统中都具有良好的预警性能。

基于经典机器学习分类模型的预警系统在诸多场景发挥了功效,然而其在处理高维非线性场景和非结构化数据时会受到较大的限制。神经网络拥有强大的函数拟合能力和广泛的通用性,近年来越来越多的研究者试图将神经网络应用于预警系统。文献[36]使用神经网络构建了商业信贷风险预警系统,其将预处理过后的信贷风险作为输入,由网络中间层自动进行特征抽取,最后由输出层判别信贷风险的等级。在政治危机预警中,文献[4]利用大量多方面的、与政治密切相关的数据建立了贝叶斯神经网络来对未来是否会发生冲突进行预测,从而实现预警。文献[37]设计了一种基于模糊神经网络的通用工业事故预警模型。模糊神经网络利用大量的人工特征进行推理,网络不仅能够对警情警度进行分类,还能够对警情类型进行分类。文献[26]视病情恶化为一个二分类问题,提出了一种新的基于attention的神经网络架构来从患者生理时序数据中自动提取特征,并输出病情恶化的概率,从而实现了病情恶化预警。为了实现更全面、准确的诊断和预警,文献[38]利用了多模态数据,具体来说,其使用了梯度提升模型来对未来某个时间点发病的概率进行预测,并由利用神经网络模型根据X射线图像输出显著图,其中模型的输入为临床数据和X射线图像,训练标签为病情在未来某个时间点是否恶化,在梯度提升模型输出发病概率的同时,神经网络输出与之相对应的显著图,从而更好地帮助医疗人员进行临床诊断以防止病情突发。文献[24]中设计的雷电预警系统在利用集成经验模态分解和稀疏自编码器进行特征提取和降维后,利用LSTM网络进行分类,实现了闪电临近预警。

综合上述,对分类的方法进行了总结,如表2所示。经典机器学习分类模型首先利用特征提取算法提取到优良的特征,再将特征送入分类器来输出类别。神经网络可以从大量数据中自动地提取特征并进行自我更新,拥有更强大的分类性能,能够适应更复杂的场景。

表  2  基于分类的方法

Tab.  2.  Classification methods

文献应用场景分类模型输入输出 [30]货币危机预警Logit/Probit经济指标数据是否将出现货币危机[31]银行破产危机预警Probit经济指标数据是否将出现银行危机[32]银行破产危机预警Logit经济指标数据是否将出现银行危机[33]学业异常预警SVM学业指标数据是否将出现学业危机[34]重型败血症预警随机森林临床指标数据是否将出现病情[35]电力系统异常预警EKNN电力设备指标数据是否将出现设备异常[36]商业信贷风险预警神经网络信贷风险指标数据信贷风险等级[4]政治危机预警贝叶斯神经网络政治指标数据是否将出现地区冲突[37]工业事故预警模糊神经网络工业指标数据事故风险等级以及事故类型[26]病情恶化预警神经网络临床指标数据是否将出现病情恶化[38]新冠肺炎病情恶化预警梯度提升模型+神经网络临床指标和图像数据发病概率和肺部显著图[24]雷电预警LSTM网络气象指标数据是否将出现雷暴

3.3.   基于回归的方法

基于回归的方法核心在于对正常状态下的指标利用回归器进行准确的预测,随后利用预测偏差来度量系统的异常程度。假设由数据X得到的特征为Z,回归器为R,则可由回归器对指标进行预测:

其中ˆyr是指标预测值。本小节将对基于回归的方法进行介绍。

在结构性经济危机预警中,文献[39]提出经济风险的若干个关键滞后因子后,利用逐步回归方法确定各因子的最佳权重来得到预测模型。模型能够预测未来三个季度的经济压力,具有良好的预警性能。在风电机组变速箱故障预警中,文献[40]认为变速箱油温出现异常是齿轮箱发生故障的重要前兆,提出了一种结合改进蚁狮优化(Improved Ant Lion Optimizer,IALO)和支持向量回归(Support Vector Regression,SVR)的回归模型。模型利用了皮尔逊相关系数来筛选输入变量,随后将多变量输入SVR模型来预测正常状态下的变速箱温度。当变速箱出现异常时,预测误差偏离了正常范围,此时系统发出预警信号。文献[41]中设计了一种猪肉价格预测与风险预警系统,其首先利用相关性分析、均方差分析和PCA得到预警指标,随后利用SVR模型来预测猪肉价格。系统通过把预测得到的价格波动率和当前实际的波动率作比较来衡量风险大小,进而实现预警任务。

在大多数简单的应用中,经典机器学习回归模型的性能良好,然而在一些场景中,时序指标的变化模式比较复杂,经典回归模型难以捕捉这些模式,因此需要借助深度神经网络来捕捉这些模式。循环神经网络(Recurrent Neural Network,RNN)的一些变种,如LSTM,GRU等,具有优良的长短期记忆能力,能够良好地捕捉时序数据的规律,在基于回归的预警模型中广被使用。文献[42]中设计了一种基于小波分解和ARIMA-GRU混合模型的外贸风险预警模型,该模型利用小波分解将外贸风险指数时序数据分解成低频数据和高频数据,对稳态、线性的低频数据采用ARIMA模型来预测,对非线性、强波动的高频数据采用GRU模型来预测,最后根据预测值相对于理论值的偏离程度来确定警级。在经济预警中,文献[43]通过市场分析构建综合预警指数来反映经济预期风险,使用遗传神经网络混合模型来对综合预警指数进行预测,并对显著高的综合预警指数发出预警信号。文献[44]提出了一种针对广义复杂系统的预警信号的识别方法,该方法训练了一个图神经网络来高效地破坏一个复杂系统。对于一个新的复杂系统,神经网络会为每个节点输出其被优先拆解的分数,节点被不断去除直到系统崩溃,系统中最大连接部分规模减小的比例被视为系统的破坏程度,系统基于该破坏程度指标发出预警信号。这样的预警方法在诸多场景都能适用,如交通阻塞预警、病毒传播预警。在设备性能退化预警中,文献[45]提出了一种基于LSTM的阶段性能退化预警方法,其基于数据和机理分析确定了若干个性能监控参数为预警指标,利用了LSTM模型来对指标进行预测,当预测值相对于预期值发生重大偏离时,认为设备性能有退化的前兆,因此发出预警信号。针对流化催化裂化预警,文献[10]利用了BiLSTM网络来预测反应温度,在反应温度异常高时发出预警信号,同时利用了PCA-SDG模型对当前状态进行推演,从而帮助决策者更好地控制风险。文献[27]中提出了一种基于CNN-LSTM的磨煤故障预警方法,其将磨煤机7个测点参数的多元时间序列作为输入,利用CNN来提取特征后,用LSTM输出多元时间序列预测值,基于预测值和实际值得到偏离度,当偏离度超出阈值时认为磨煤机有发生故障的趋势,此时发出预警信号。

综合上述内容,对回归的方法进行了总结,如表3所示。经典回归模型在处理变量少、任务简单的场景下能达到较好的性能。越来越多的研究关注于利用LSTM、GRU等神经网络来捕捉时序中的规律,从而在复杂场景下达到更好的预警目的。

表  3  基于回归的方法

Tab.  3.  Regression methods

文献应用场景回归模型输入输出 [39]经济危机预警逐步回归经济风险滞后因子数据经济压力指数预测值[40]风电机组变速箱故障预警SVR变速箱指标数据变速箱温度预测值[41]猪肉价格预测与预警SVR猪肉价格相关指标数据猪肉价格预测值[42]外贸风险预警ARIMA+GRU网络外贸风险指标时序数据外贸风险指标值预测值[43]经济下行预警神经网络市场监测指标市场综合预警指数预测值[44]多场景图神经网络各系统监测指标数据系统破坏程度预测值[45]设备性能退化LSTM网络设备性能监测指标数据性能指标预测值[10]流化催化裂化预警BiLSTM网络流化催化裂化监测指标数据反应温度预测值[27]磨煤故障预警LSTM网络磨煤机故障相关时序数据时序预测值

4.   基于专家系统的预警系统

专家系统起始于20世纪60年代,是一种根据规则进行推理和决策的智能程序系统,是人工智能的一个发展分支。专家系统的工作流程如图2所示,其通过知识获取将专家知识保存于知识库中,使用者利用人机交互接口来输入问题,专家系统利用知识库和推理机来得到判断,随后再次通过人机交互接口来输出结果。专家系统以知识推理为核心,决策具有较高的科学性、稳定性。本节将对基于专家系统的预警系统进行介绍。

图  2  专家系统流程图

Fig.  2.  Schematic of expert system

文献[46]将分层模糊专家系统应用于钻井溢流预警系统中,系统利用了专家的经验知识建立知识库,并设计了推理机来模拟专家估计溢流程度,当溢流程度大时发出预警信号。文献[47]构建了一种基于专家系统的城市供水网管安全预警系统。系统结合了行业内学者专家的研究成果构造了趋势面模型来计算管网管线压力,并基于该模型设计了知识库;通过对引发管网爆管的相关指标进行监测,推理机可以计算出管网爆管概率,并在爆管概率高时发出预警信号。在光伏阵列故障预警中,文献[48]设计了基于规则、案例、神经网络的三种专家系统。基于规则的专家系统利用了树结构将故障知识转换成产生式规则,并将规则保存到知识库中;基于案例的专家系统将原案例使用矩阵来表达,并将该表达矩阵放于知识库中,有待检案例便可计算其与源案例的相似度,从而进行推断;基于神经网络的专家系统将由光伏历史数据提取到的故障特征向量用于神经网络训练,并将神经网络保存在知识库中。文献[49]中首次在干旱预警领域中利用了专家系统。该方法基于专家的领域知识建立了一个规则库,接着利用规则库来对真实场景下的输入数据模式产生概率式推理,并引入了确定性因子来度量推理的不确定性,系统最终同时输出土地质量评估和置信水平,实现了基于领域知识的自动干旱预警。文献[50]在洪水预警中发现洪水的相关监测指标在监测过程存在不确定性,即某时刻若干监测指标会出现空缺值,且监测指标和输出之间存在非线性关系。为了处理这种输入不确定性、输入输出非线性的场景,该文使用了模糊专家系统来构建洪水预警系统。在井漏预警过程中,文献[51]为了应对监测数据高度不确定的情况,设计了基于模糊专家系统的井漏预警系统。系统模拟了专家在钻井过程中根据监测数据来对井漏的类型和程度作出决策的过程,实现了准确、高效的预警。

基于专家系统的预警系统可以在输入高度不确定、输入输出非线性的预警场景发挥良好的作用。专家系统可以有效地利用历史经验,针对具体场景进行逻辑推理,作出的决策具有更强的可解释性。

5.   基于信息融合的预警系统

在一些复杂场景中,仅凭单一的信息源可能很难作出全面、准确的评价,此时需要结合多个信息源,如图3所示。信息融合技术可以自动融合多源信息,帮助预警系统作出更加全面、合理的决策。按照融合时信息的抽象程度,信息融合可分为数据层融合、特征层融合和决策层融合,如图4所示。数据层融合指对各个信息源的原始数据进行分析和关联,进而得到更全面、更精确的数据。数据层融合需要对不同源的原始数据直接进行融合,因此要求数据是同构的。特征层融合指对从各个信息源提取到的特征进行融合。特征层融合将原始数据进行特征抽取之后再处理,因此也适用于异构数据。决策层信息融合指对各个信息源独立作出的决策进行集成。决策层融合方法直观,易于设计,因此应用场景较为广泛。本节将对基于信息融合方法的预警系统进行介绍。

图  3  信息融合示例

Fig.  3.  Example of information fusion

图  4  不同层的信息融合

Fig.  4.  Information fusion of different levels

文献[52]提出的露天矿边坡动态预警系统采用了联邦Kalman滤波,其融合同一剖面多测点的位移监测信息,获得了各剖面实时稳定状态的动态位移融合值,并将动态位移融合值和动态位移分级预警阈值相比较来实现分级预警。在文献[53]中提出了一种基于两级信息融合的隧道掘进机拆装装置作业安全模型。第一级融合是数据层融合。系统通过层次分析法和熵权法来将不同数据进行加权结合,从而得到综合预警指标。第二级融合是决策层融合。系统将GM、ARIMA、LSTM三个模型分别对综合预警指标进行预测,随后集成三个模型的预测结果得到最终预测和判断警级。在室内火灾预警系统中,文献[54]提出的预警系统分别采集了气候、烟浓度、一氧化碳浓度数据。系统在提取得到特征后,将所有特征输入到神经网络,神经网络在训练过程中自动融合了多源信息。在测试时,预警系统可以基于不同气体的采集数据来输出火灾的发生概率,从而完成室内火灾预警任务。对于电气火灾预警,文献[9]设计的预警系统在对采集到的多源信息提取特征后,将特征输入到多组神经网络来得到多组的火灾概率预测值。基于D-S证据理论的证据融合规则,系统将多个预测值进行融合,实现了良好的预警性能。在新冠肺炎死亡预警中,文献[55]提出的系统使用了四种模型分别预测患者在未来二十四小时内死亡的概率,随后利用加权投票法将不同的预测结果进行融合。文献[56]提出了一种针对ARDS发作的实时预警系统。为了克服单个信号决策不及时的问题,系统对受试者的心率、呼吸频率、血氧饱和度等多个生理信号进行实时采集,当系统发现单个信号出现异常,将计算所有信号的偏离程度,随后利用核岭回归来对多个信号的决策信号进行融合。实验证明该方法实现了更快速、更精确的预警。文献[57]提出了一种基于多传感器数据融合的隧道故障预警方法。隧道在发生故障之前,会出现一系列征兆,例如声发射静默期、基于声发射的b值快速下降、声发射熵和应变场协方差的快速增加,为了及时发现危险前兆,系统采用了多传感器来监测数据,随后通过D-S证据理论融合多个预警分数,实现了决策融合。在COVID-19病情恶化风险预警中,文献[38]提出的预警系统分别利用了梯度提升模型和神经网络模型来对未来某个时间点发病的风险进行预测,最后将结果进行集成得到了最终预测概率。其中,梯度提升模型的输入为患者的临床数据,神经网络的输入为患者的X射线图像。该系统利用了表格和图像数据,实现了异构数据的融合决策。

根据上述内容对基于信息融合的预警系统进行了总结,如表4所示。同构数据可以在各种层次进行信息融合。异构数据的不同数据源的含义和量纲不同,因此大多在特征层或决策层完成信息融合。数据层的信息融合通常是综合考虑多个传感器多方面的数据,以此减少误差或使信息更为全面。数据层融合比较直观,但容易造成信息丢失;特征层信息融合最常见的做法是利用神经网络来自动处理不同的特征。神经网络能够对不同特征进行最优融合,以提升预警性能,然而,这种融合方式缺乏可解释性,提取到的特征缺乏物理意义。决策层的信息融合通常是集成多个模型的预测结果来得到最终决策,决策层融合方法比较直观,且易于设计,因此广泛被使用。

表  4  基于信息融合的方法

Tab.  4.  Methods based on information fusion

文献应用场景融合层次融合方法 [52]露天矿边坡动态预警数据层Kalman滤波[53]隧道掘进机拆装装置作业安全预警数据层+决策层层次分析法+熵权法+多模型加权决策[54]室内火灾预警特征层神经网络自动融合特征[9]电气火灾预警特征层+决策层互信息+基于DS证据理论的集成决策[55]新冠肺炎死亡预警决策层加权投票法[56]ARDS发作预警决策层核岭回归[57]隧道故障预警决策层基于DS证据理论的集成决策[38]COVID-19病情恶化预警决策层多模型加权决策

6.   总结与展望

一个良好的预警系统可以让目标人群可预备即将发生的危险,进而规避伤害。构建良好的预警系统是一项重要且富有挑战性的任务。传统预警系统存在着诸多局限性,这促使研究人员不断探索性能更优、适用性更强的预警系统。近年来,随着人工智能的蓬勃发展,诸多智能方法被应用于预警系统中,这大大提升了预警系统的性能。本文对预警系统中的智能方法进行了综述,首先简要介绍了传统预警方法及其局限性,随后阐述了预警系统中的机器学习方法,其中包括特征提取方法、基于分类的方法和基于回归的方法,最后介绍了基于专家系统的预警系统和基于信息融合的预警系统。总的来说,基于机器学习的方法以数据为支撑,从数据中挖掘出预警场景的关键信息,进而完成预警。基于专家系统的方法利用专家知识来构建预警系统。基于信息融合的方法能够综合考虑多个信息源的数据来实现预警。

当前,利用智能方法的预警系统在诸多领域都展现出了良好的性能。然而,这类方法仍存在诸多挑战。以下将对预警系统智能方法中存在的一些局限性和未来可能的发展方向进行分析和探讨。

(1)基于学习的方法需要大量的样本进行训练,然而在一些特定的场景中,样本数量常常是稀少的,样本不足可能会导致模型过拟合,从而影响预警性能。因此,如何在小样本的情况下使用机器学习,是设计预警系统智能方法时需要解决的一个问题。

(2)越复杂的机器学习模型需要越多的数据量。在真实场景中,一部分预警过程可以用物理模型来表达。如果能将物理模型和机器学习模型相结合[58],可大大减少机器学习模型的复杂度,从而减少所需要的数据量。因此,如何更好地将两种模型相结合是值得研究的一个问题。

(3)在预警系统的智能方法中,基于数据的学习方法可以在数据和算力的支持下达到较高的精度,而基于知识的推理方法能够利用专家知识解决特定场景下的复杂问题。在当前的预警系统智能方法中,基于学习的方法和基于推理的方法是分离的。如果将机器学习和逻辑推理结合工作,预警系统能够达到更高的智能水平,这也是预警系统智能方法在未来值得研究的方向。

(4)近年来以ChatGPT为代表的大型语言模型应运而生,其在事件识别、文本分析等场景发挥了作用。如何将ChatGPT这类新技术应用于预警系统也是值得研究的一个方向。

相关知识

光纤预警系统在长输管道保护中的应用
病虫害智能监测预警系统
智能病虫害监测预警系统
大田作物病虫害智能预警系统的制作方法
智能病虫害监测预警系统在林业系统的应用
农作物病虫害AI智能监测预警系统
智能虫情自动监测预警系统
天空地植物病虫害智能监测预警系统正式发布
病虫害预警系统在农业种植中的作用
水稻病虫智能监测预警系统,你听说过吗?

网址: 预警系统中的智能方法综述 https://m.huajiangbk.com/newsview374539.html

所属分类:花卉
上一篇: 杭州千岛湖水质水华预测预警系统显
下一篇: 千岛湖水质水华预测预警系统正式发