首页 > 分享 > 一种基于ATR

一种基于ATR

一种基于ATR-FTIR的金银花和山银花中药制剂的鉴别方法与流程

本发明属于中药光谱鉴定技术领域,具体涉及一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法。

背景技术:

金银花(lonicerajaponicathumb.)和山银花都是常用的中药材,自古便被誉为清热解毒、疏风散热的良药。《药典》规定,忍冬的花称为金银花(lonicerajaponica),而忍冬科植物灰毡毛忍冬(loniceramacranthoideshand.-mazz.)、红腺忍冬(lonicerahypoglaucamiq.)、华南忍冬(lonicaraconfusedc.)和黄褐毛忍冬(lonicerafulvotomentosahsuets.c.cheng)的花成为山银花。

金银花和山银花的化学成分主要有有机酸类、黄酮类、三萜皂苷类、环烯醚萜类、挥发油类以及微量元素等,但是他们在化学成分的组成和含量上有一定的差异。金银花和山银花均含有绿原酸,它们化学成分种类的主要差异表现在黄酮类的木犀草苷和三萜皂苷类的灰毡毛忍冬皂苷乙和川续断皂苷乙。金银花含有木犀草苷,但是山银花木犀草苷含量较少或几乎不含;灰毡毛忍冬皂苷乙和川续断皂苷乙在山银花中含量较多,而再金银花中含量较少或几乎不含。由于二者原植物种属相近、药材外观形态相似,难以区分,因此市场上金银花和山银花药材品种混乱、来源不清、质量良莠不齐的现象极为突出,进而直接影响到药材及其制剂的疗效。

现有的金银花、山银花鉴别方法均存在不足之处。如经验鉴别方法,需要鉴定人员具有丰富的药材知识以及多年的实际鉴别经验,即使知识和技能达到要求,鉴别结果也存在着极大的偶然性和人为因素。而化学成分分析法,是对几种主要化学成分进行检测,难以体现药材的整体质量。dna分子鉴定法技术复杂、成本高,结果重复性差。这些方法虽然可以在一定程度上对近缘品种进行区分,但无法对药效的优劣进行评价。同时,金银花是许多中药方剂的原料药材,现有方法很难对中药制剂中原料的投料情况进行考察。

技术实现要素:

本发明实施例通过提供一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据,再对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。

一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,步骤包括:

检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据;

对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集;

将所述光谱数据集分为校准集和验证集;

建立金银花和山银花中药制剂的判别模型;

采集待测样品的atr-ftir光谱数据,用所述判别模型对待测样品进行鉴别。

其中,利用kennard-stone算法将光谱数据集划分为校准集和验证集。

校准集为所有金银花和山银花药材样品的4/5。

优选地,上述方法还包括在建立金银花和山银花中药制剂的判别模型之后,用验证集对所述判别模型进行验证。

验证的方法为5倍交叉验证。5倍交叉验证即将数据分为5个部分,每次取其中一个部分,剩余部分用来做测试,共需要进行5次。

优选地,所述atr-ftir光谱数据的检测范围是4000~600cm-1。

优选地,所述atr-ftir光谱数据的检测器的分辨率为4cm-1。

优选地,所述预处理为一阶导数化与矢量归一化处理。

归一化处理包括面积归一化、最小-最大归一化和矢量归一化,其中矢量归一化包括一阶导数化与矢量归一化和二阶导数化与矢量归一化。一阶导数化与矢量归一化处理后的数据建立出的随机森林模型参数值高,即模型预测结果更准确。

进一步优选地,所述一阶导数化的平滑点数为9个。

进一步优选地,所述一阶导数化采用的导数为savitzky-golay导数。

优选地,所述校准集的波数区域包括4000-600cm-1、2000-600cm-1、4000-2000cm-1和4000-600cm-1。

进一步优选地,所述校准集的波数区域为4000-600cm-1。

优选地,所述判别模型为随机森林模型,所述随机森林模型的树的数目包括100、200、300、500、800和1000。

进一步优选地,所述随机森林模型的树的数目为300。

优选地,所述随机森林模型的节点数目包括82、84、86、88、90、92、94和96。

进一步优选地,所述随机森林模型的节点数目为86。

优选地,所述随机森林模型的vip值包括0.05、0.01、0.015和0.020。

进一步优选地,所述随机森林模型的vip值为0.01。

随机森林模型的操作过程可以分为以下几个步骤:

首先,利用kennard-stone(ks)算法将光谱数据集分为校准集(bootstrapsamples)和验证集(out-of-bagsamples)。利用校准集获得最优分类树,利用验证集评价随机森林模型的能力;

其次,选取树数量ntree的值和节点变量mtry个数的平方根,根据最小oob分类误差值获得最优ntree和mtry;

再次,利用最优ntree和mtry构造了一个新的重要变量矩阵;

第四,在生产者中插入新的矩阵,根据变量的重要性对原始光谱变量进行重新排列,通过交叉验证错误率选择最重要的变量;

最后利用优化后的ntree和mtry参数建立最终的识别模型。重新运行前两个步骤来计算最终的分类精度。

中药指纹图谱是基于对中药或中药制剂一定认识的基础上,适当处理药材或制剂后借用光谱或色谱等分析仪器,主要用于评价中药材以及中药制剂半成品的鉴定。中药指纹图谱的一般方法有:光谱法,包括uv法、ir法、ft-ir法和nir法等;色谱法,包括hplc法、tlc法和gc法等;此外还有质谱法、核磁共振法、x射线法和免疫测定法等。光谱法中,将衰减全反射(attenuatedtltalrefraction,简称atr)红外附件应用到傅里叶变换红外光谱仪上,产生了傅里叶变换衰减全反射红外光谱仪(attenuatedtotalinternalreflectancefouriertransforminfraredspectroscopy,简称atr-ftir),极大地简化了一些特殊样品的测试,使微区成分的分析变得方便而快捷,检测灵敏度可达10-9g数量级,测量显微区直径达数微米。然而,由于atr-ftir光谱的数据数据信息量大,目前尚无高效的处理方法。

本发明实施例通过提供一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据,再对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。

除了使用atr-ftir光谱外,还可以使用拉曼光谱,拉曼光谱是一种非破坏性分析工具,可以很容易地集成到工艺中,并通过最少的样品制备提供增强的化学信息,然而拉曼光谱仪器成本高、检测费用贵。

二阶导数红外光谱法(sd-ir)和二维相关红外光谱法(2d-ir)也是可行的,可用于解决重叠带,增强相似草药样品的光谱差异,得到更准确的数据,建立分类模型,然而同样存在的问题是仪器成本高、检测费用贵。

本发明实施例的有益效果

1、本发明实施例提供了一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据,再对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别,解决了现有技术中,金银花和山银花中药制剂鉴别难的问题;

2、本发明实施例提供的方法,与现有技术相比,样本无需复杂的前处理,具有检测速度快、操作简单方便和预测结果准确的优点;

3、本发明实施例建立的金银花与山银花中药制剂判别模型,相对于其他化学计量学方法建立的模型,能够更快的获得鉴别结果,且鉴别结果可靠。

附图说明

图1为金银花和山银花的atr-ftir光谱,其中,曲线1为金银花光谱数据,2为山银花光谱数据。

图2为金银花和山银花中药制剂的atr-ftir光谱,其中,曲线1为金银花中药制剂光谱数据,2为山银花中药制剂光谱数据。

具体实施方式

本发明实施例通过提供一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,该方法先检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据,再对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集,然后将光谱数据集分为校准集和验证集,建立金银花和山银花中药制剂的判别模型,用判别模型对待测样品进行鉴别。解决了现有技术中,金银花和山银花中药制剂鉴别难的问题。

为了更好的理解上述技术方案,下面将结合具体的实施方式对上述技术方案进行详细地说明。

实施例1

本例提供了一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,步骤包括:

检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据;

对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集;

将所述光谱数据集分为校准集和验证集;

建立金银花和山银花中药制剂的判别模型;

采集待测样品的atr-ftir光谱数据,用所述判别模型对待测样品进行鉴别。

其中,利用kennard-stone算法将光谱数据集划分为校准集和验证集。

校准集为所有金银花和山银花药材样品的4/5。

上述方法还包括在建立金银花和山银花中药制剂的判别模型之后,用验证集对所述判别模型进行验证。

验证的方法为5倍交叉验证。5倍交叉验证即将数据分为5个部分,每次取其中一个部分,剩余部分用来做测试,共需要进行5次。

atr-ftir光谱数据的检测范围是4000~600cm-1。atr-ftir光谱数据的检测器的分辨率为4cm-1。

预处理为一阶导数化与矢量归一化处理。归一化处理包括面积归一化、最小-最大归一化和矢量归一化,其中矢量归一化包括一阶导数化与矢量归一化和二阶导数化与矢量归一化。一阶导数化与矢量归一化处理后的数据建立出的随机森林模型参数值高,即模型预测结果更准确。一阶导数化的平滑点数为9个。一阶导数化采用的导数为savitzky-golay导数。

校准集的波数区域为4000-600cm-1。判别模型为随机森林模型,所述随机森林模型的树的数目为300。随机森林模型的节点数目为86。vip值为0.01。

随机森林模型的操作过程可以分为以下几个步骤:

首先,利用kennard-stone(ks)算法将光谱数据集分为校准集(bootstrapsamples)和验证集(out-of-bagsamples)。利用校准集获得最优分类树,利用验证集评价随机森林模型的能力;

其次,选取树数量ntree的值和节点变量mtry个数的平方根,根据最小oob分类误差值获得最优ntree和mtry;

再次,利用最优ntree和mtry构造了一个新的重要变量矩阵;

第四,在生产者中插入新的矩阵,根据变量的重要性对原始光谱变量进行重新排列,通过交叉验证错误率选择最重要的变量;

最后利用优化后的ntree和mtry参数建立最终的识别模型。重新运行前两个步骤来计算最终的分类精度。

实施例2

本例提供了一种基于atr-ftir的金银花和山银花中药制剂的鉴别方法,步骤包括:

检测金银花和山银花样品,获得金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据;

对所述金银花的atr-ftir光谱数据和山银花的atr-ftir光谱数据进行预处理,获得光谱数据集;

将所述光谱数据集分为校准集和验证集;

建立金银花和山银花中药制剂的判别模型;

采集待测样品的atr-ftir光谱数据,用所述判别模型对待测样品进行鉴别。

其中:

样本收集

金银花和山银花的干燥花蕾样本购自中国湖南、山东两省主产地。金银花和山银花成分的中药制剂购自权威药店。

样本处理

所有金银花与山银花药材样品磨成粉末,在60℃的电动恒温干燥箱中干燥至恒重(体重变化小于0.1%),每个样品用乳钵细磨成粉末,用200目不锈钢筛网进行筛分。金银花与山银花的相关处方药同样磨成粉末,每个样品用乳钵细磨成粉末,用200目不锈钢筛网进行筛分。所有的样本储存在相对干燥的环境中。

采集atr-ftir光谱

红外光谱仪为nicoletis5,thermoscientific,usa,该光谱仪配有一个衰减全反射(atr)附件,omnic程序(版本8.2.0.387,thermoscientific,waltham,massachusetts,usa)用于获取所有atr-ftir光谱。记录信号累计64次,检测范围在4000-600cm–1之间,检测器分辨率为4cm–1。

检测所得金银花和山银花atr-ftir谱如图1所示。对光谱进行了分析,并观察到几个明显的峰。主要吸收峰的分配也总结在表1中。

4000-3500cm-1归属于水的o-h伸缩振动峰。2442-2208cm-1归属于二氧化碳的o-c-o伸缩振动峰。o-h在3350cm-1附近的伸缩振动峰和c-o在1200-950cm-1区域的伸缩振动峰表明金银花和山银花中存在糖类。金银花和山银花光谱在这一区域显示出不同的模式,这意味着金银花和山银花中的糖类是不同的。2920cm-1和2851cm-1处的峰值归因于ch2的不对称和对称伸缩振动峰[,以及1729cm-1附近c=o的伸缩振动峰,表明存在脂质。金银花和山银花被角质层覆盖,角质层是一层连续的脂质膜,包括角质、蜡、肉和多糖。2920、2851和1729cm-1附近的吸收峰来自角质和蜡,由酸、醇、酯、烷烃等组成。1630cm-1附近的吸收峰是由于c-o和c-n蛋白伸缩振动峰。这被称为酰胺i带,是主要的酰胺带。1440和1374cm-1处的峰值归因于有机酸oh振动模式。1321和1259cm-1处的峰值是由c–o伸缩振动峰造成的。1150cm-1附近的峰值被分配到胆固醇酯的c-o-o-c不对称拉伸和低聚糖和三酰甘油的c-o伸缩振动峰。一个在1051cm-1由于c-o伸缩振动峰淀粉。

金银花在1545cm-1处显示酰胺ii带,而山银花在1528cm-1附近显示芳香骨带。这表明金银花含有更多的蛋白质,而山银花含有更多的芳香化合物(酚酸、类黄酮等)。此外,金银花在1400cm-1处出现峰值,在930cm-1处出现弱峰,这两个峰在山银花中都不存在。1400cm-1处的峰可分配给o-c-h的弯曲模式,而930cm-1处的峰可对应于糖的骨架模式。这两个峰表明金银花和山银花中的糖类不同。另一个鉴别峰在780cm-1附近,存在于山银花中,但不存在于金银花中。这种差异可能是由于山银花中的皂苷含量高造成的。

表1金银花与山银花atr-ftir光谱中峰位归属

表1中,v表示伸缩振动;νs表示对称伸缩振动;νas表示不对称伸缩振动;δ表示弯曲振动;skeletal表示骨架;δoop表示面外弯曲振动。

综上,金银花和山银花可通过1545、1400、930和780cm-1附近的四个峰来区分。

图2为金银花和山银花中药制剂的atr-ftir光谱,其中,曲线1为金银花中药制剂光谱数据,2为山银花中药制剂光谱数据。3000-2800cm-1、1700-1500cm-1、1000-700cm-1波数区域中,明显显示出金银花和山银花中药制剂的差异,而且,在这三个波数区域中,包含了可用于识别金银花和山银花的吸收峰。

光谱数据处理

对于得到的光谱数据进行一阶导数化与矢量归一化。利用omnic软件将所有光谱由透射率转换为吸光度,采用savitzky-golay导数和9个平滑点将atr-ftir吸光度光谱转换为一阶导数。矢量归一化采用欧氏范数计算吸光度值,得到光谱的归一化值。

选择校正样品集和验证样品集

在matlab编程环境下对金银花和山银花药材样本进行分类预测,建立随机森林模型。

在本发明的实施例中,利用kennard-stone算法将光谱数据集划分为校准集和验证集。校准集为所有金银花和山银花药材样品的4/5,并使用5倍交叉验证来证明方法。

金银花与山银花药材判别模型的建立与验证

在校准集中,对atr-ftir波数区域4000-600cm–1(不用去除水与二氧化碳)的光谱数据进行一阶导数矢量归一化处理,建立随机森林模型。选择300棵树,86节点,vip(variableinfluenceonprojection)值为0.01。

计算真阴性(tn)、真阳性(tp)、假阴性(fn)和假阳性(fp)的值。

式(1)为灵敏度(sensitivity,简称sens);

式(2)为特异性(specificity,简称spec);

式(3)为准确度(accuracy,简称acc);

式(4)为马修相关系数(matthew’scorrelationcoefficient,简称mcc)。

式(1)~(4)为每类的四个参数,这四个参数值越大,表示每个类的识别能力越好。

本例采用随机森林、支持向量机和pls-da模型,在matlab编程环境下对金银花和山银花样本进行分类预测。利用kennard-stone算法将光谱数据集划分为校准集和验证集。校准集为所有金银花和山银花样品的4/5。在这三个模型的训练过程中,本研究使用了5倍交叉验证来证明方法的性能。

在建立随机森林模型时,首先通过训练过程选择树的数目作为最优分类树模型。在此步骤之前,首先用300棵树计算原始数据集和归一化数据集,以选择哪个数据集更适合建立随机森林模型。在原始数据集和规范化数据集的基础上,建立了支持向量机和pls-da模型。

如表2所示,在校准集中进行第一次微分后,通过应用适当的向量归一化,随机森林模型显示了性能。随机森林模型的sens、spec、acc、mcc分别为0.9706、1、0.9844和0.9692,优于其他预处理方法。在精确度方面,随机森林模型在总体精确度方面也优于pls-da和svm模型。与分类器相比,随机森林模型的最高精度分别比pls-da高0.0071和svm高0.0071。

表2.通过对金银花与山银花样本之间的归一化和光谱滤波变换预处理,建立的rf、pls-da、svm模型的参数比较

此外,表3列出了评估三种模型性能的验证集,可以看出,一阶导数向量归一化的随机森林模型是识别金银花和山银花的最佳预测模型,acc为0.9744。

利用树的数目、波数区域和vip截止值来获得最佳的预测随机森林模型模型。根据最小的oob分类误差值,得到最优树数。

表3.rf、pls-da、svm模型结合一阶导数矢量归一化对金银花与山银花的分类结果及参数比较

如表4所示,这些误差最小的树的数目为100、200、300、500、800、1000。这些树精度最高的是300棵树。然后,选择300棵树作为分支节点选择(mtry值)。利用这300棵树,得到了表4中的节点计算结果。在校准集中,输入最优树数、oob误差最小,共选取86个分支节点,此时精度最高为0.9886。结果表明,该模型采用300个树和86分支节点进行进一步的训练和预测。

表4.随机森林模型中参数筛选的精度值比较

由于atr-ftir光谱可能受到水蒸气、二氧化碳等环境因素的影响,将利用不同波数区域建立的随机森林模型进行了比较,以确定最佳预测模型。目前的红外光谱都采用波数等距,为了防止吸收曲线在高波数(短波)区过分扩张,一般采用两种比例尺,多以2000cm-1(5μm)为界。如表5所示,筛选区域分别为:4000-600cm-1(除去水和二氧化碳)、4000-600cm-1、4000-2000cm-1、2000-600cm-1。、在4000-600cm–1之间的atr-ftir光谱区域是识别金银花和山银花的最佳预测模型,因为它具有最高的acc(=0.9844)。

表5.结合一阶导数矢量归一化法及300棵树对于随机森林模型的波数区域筛选的参数比较

如表6所示,根据vip值的变化影响,重新排列原始光谱变量。在4000-600cm–1之间的atr-ftir光谱区域中建立识别金银花和山银花的随机森林预测模型,当vip值为0.01时,具有最高的acc(=0.9886)。

表6.对于金银花和山银花在4000-600cm-1波数区域中结合vip值的参数比较

金银花和山银花相关处方分别由金银花和山银花作为主要组成的复方制剂。因此,本例利用上述分类和预测模型,进一步将该模型应用于识别金银花和山银花相关处方。如前所述,本研究认为识别金银花和山银花的最佳预测随机森林模型能够在识别金银花和山银花相关处方上显示出适当的性能。用随机森林模型计算了金银花和山银花两种传统药物的atr-ftir光谱数据,四个评价参数(sens、spec、acc、mcc)均为1。结果表明,建立的随机森林模型是区分金银花和山银花相关处方的最佳预测模型。

相关知识

光纤红外光谱技术助力非侵入性、原位植物健康监测
一种基于排水装置的花盆架的制作方法
一种基于图像识别的茶园病虫害监测系统
一种基于基因沉默技术矮化芍药的方法
一种基于AI的无人值守农作物病虫害监测预警系统
一种基于花朵特征的植物种类识别系统.pdf
一种基于数字农场的智能施肥及施药系统
一种基于矿山生态修复的植被配置方法技术
一种基于Arduino的智能浇花系统的制作方法
一种基于节能环保技术的节水型花盆的制作方法

网址: 一种基于ATR https://m.huajiangbk.com/newsview1272378.html

所属分类:花卉
上一篇: 金银花茶制作过程以及注意事项
下一篇: 家里养盆它,10天蹿1米,开花爬