首页 > 分享 > k近邻法

k近邻法

最新推荐文章于 2021-04-01 19:32:56 发布

曼陀罗彼岸花 于 2015-09-15 22:00:06 发布

k近邻法

    k近邻法(k nearest neighbor algorithm,k-NN)是机器学习中最基本的分类算法,在训练数据集中找到k个最近邻的实例,类别由这k个近邻中占最多的实例的类别来决定,当k=1时,即类别为最近邻的实例的类别。

                                               

    如上图所示(引自wiki),当k=3时,此时红色的个数为2,则绿色的输入实例的类别为红色的三角形,当k=5时,此时蓝色的个数为3,输入实例的类别为蓝色的四边形。
    在分类过程中,k值通常是人为预先定义的常值,从上图可以看出,k值的选取对会对结果有很多的影响。大的k值可以减小噪声对分类的影响,但是和实例较远的实类会对判决起作用,通常采用交叉验证的方式来选取最优的k值。

    通常实类间的距离通常采用欧氏距离,这主要面向的是连续的特征变量,对于文本分类问题,可以采用汉明距离(Hamming distance),定义为两个字符串对应位置的不同字符的个数。对距离的度量很多,往往按照应用来决定。
    k近邻法的最简单的实现就是线性扫描,当训练集的数据很大,特征的维度很高的时候,计算量就会过于巨大,可以通过建立k-d tree进行快速搜索k近邻。

继续阅读

http://blog.csdn.net/hust_core/article/details/7628177

http://www.cnblogs.com/eyeszjwang/articles/2429382.html

http://www.cnblogs.com/eyeszjwang/articles/2432465.html

相关知识

K近邻算法和鸢尾花问题
人工智能考试——k近邻算法对鸢尾花(iris)数据集进行分析
使用K
用python实现KNN算法对鸢尾花的分类
利用KNN对150个实例对花卉进行机器培训
K=K纸箱耐破强度=150LBS/IN???是否标准太低? 爱问知识人
“花”点心思 留住近邻,扬州甘泉社区开展老年手工花艺活动
设散列表的地址空间为 0到10,散列函数为 h(k)=k mod 11,用线性探
【机器学习】鸢尾花分类:机器学习领域经典入门项目实战
生产性生物资产的评估方法有关市场法的评估公式V=K×Kp×P×M,下列选项中,说

网址: k近邻法 https://m.huajiangbk.com/newsview398116.html

所属分类:花卉
上一篇: 线性回归模型
下一篇: 降低汽车噪音的方法