目录
一、相关概念
1.1、什么是支持向量机
1.2、一个线性相关的例子
1.3、 函数间隔(Functional margin)与几何间隔 (Geometrical margin)
1.4、最大间隔分类器
二、SMO算法(一种启发式算法)
2.1、SMO算法的基本思路
2.2、两个变量二次规划的求解方法
2.3、变量的选择方式
三、编程求解线性SVM
3.1、可视化数据集
3.2、简化版SMO算法求解
3.3、编程实现非线性SVM
3.4、编写核函数及其测试
四、总结
4.1、SVM的优缺点:
支持向量机(support vector machines,SVM)是一种二分类模型,它的目的是寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解。
1.2、一个线性相关的例子下面举个简单的例子,如下图所示,现在有一个二维平面,平面上有两种不同的数据,分别用圈和叉表示。由于这些数据是线性可分的,所以可以用一条直线将这两类数据分开,这条直线就相当于一个超平面,超平面一边的数据点所对应的y全是 -1 ,另一边所对应的y全是1。

这个超平面可以用分类函数表示,当f(x) 等于0的时候,x便是位于超平面上的点,而f(x)大于0的点对应 y=1 的数据点,f(x)小于0的点对应y=-1的点,如下图所示:
接下来的问题是,如何确定这个超平面呢?从直观上而言,这个超平面应该是最适合分开两类数据的直线。而判定“最适合”的标准就是这条直线离直线两边的数据的间隔最大。所以,得寻找有着最大间隔的超平面。
1.3、 函数间隔(Functional margin)与几何间隔 (Geometrical margin)在超平面w*x+b=0确定的情况下,|w*x+b|能够表示点x到距离超平面的远近,而通过观察w*x+b的符号与类标记y的符号是否一致可判断分类是否正确,所以,可以用(y*(w*x+b))的正负性来判定或表示分类的正确性。于此,我们便引出了函数间隔(functional margin)的概念。
定义函数间隔(用表示)为:
而超平面(w,b)关于数据集T中所有样本点(xi,yi)的函数间隔最小值(其中,x是特征,y是结果标签,i表示第i个样本),便为超平面(w, b)关于训练数据集T的函数间隔:
但这样定义的函数间隔有问题,即如果成比例的改变w和b(如将它们改成2w和2b),则函数间隔的值f(x)却变成了原来的2倍(虽然此时超平面没有改变),所以只有函数间隔还远远不够。
事实上,我们可以对法向量w加些约束条件,从而引出真正定义点到超平面的距离--几何间隔(geometrical margin)的概念。
假定对于一个点 x ,令其垂直投影到超平面上的对应点为 x0 ,w 是垂直于超平面的一个向量,为样本x到分类间隔的距离,如下图所示:
有
,其中||w||表示的是二阶范数。
又由于 是超平面上的点,满足 ,代入超平面的方程即可算出:

为了得到的绝对值,令乘上对应的类别 y,即可得出几何间隔(用表示)的定义:

从上述函数间隔和几何间隔的定义可以看出:几何间隔就是函数间隔除以||w||,而且函数间隔y*(wx+b) = y*f(x)实际上就是|f(x)|,只是人为定义的一个间隔度量,而几何间隔|f(x)|/||w||才是直观上的点到超平面的距离。
1.4、最大间隔分类器对一个数据点进行分类,当超平面离数据点的“间隔”越大,分类的确信度(confidence)也越大。所以,为了使得分类的确信度尽量高,需要让所选择的超平面能够最大化这个“间隔”值。这个间隔如下图中的gap / 2所示。

通过由前面的分析可知:函数间隔不适合用来最大化间隔值,因为在超平面固定以后,可以等比例地缩放w的长度和b的值,这样可以使得的值任意大,亦即函数间隔可以在超平面保持不变的情况下被取得任意大。但几何间隔因为除上了,使得在缩放w和b的时候几何间隔的值是不会改变的,它只随着超平面的变动而变动,因此,这是更加合适的一个间隔。所
相关知识
【机器学习实验六】支持向量机(SVM)
机器学习实践:基于支持向量机算法对鸢尾花进行分类
SVM支持向量机分类鸢尾花数据集iris及代码:精准分类,助力机器学习入门
R: 支持向量机(Support Vector Machine,简称SVM)
MATLAB实现鸢尾花数据集的支持向量机(SVM)分类
sklearn机器学习支持向量机案例解析
日常学习记录——支持向量机、随机森林对鸢尾花数据集进行分类
探索MATLAB支持向量机分类:从入门到精通
R语言与支持向量机SVM应用实例
支持向量机(SVM)代码实现学习记录
网址: 【机器学习实验六】支持向量机(SVM) https://m.huajiangbk.com/newsview2508854.html
| 上一篇: R: 支持向量机(Support |
下一篇: 主成分分析应用实例(Matlab |