(1)将鸾尾花数据分为训练集和测试集,用来读取数据。
(2)处理训练集数据,将数据重拍,变量与标签分离。
(3)标准化语法(归一化:0~1)
(4)使用sklearn库中的KNN模块训练,再使用测试集数据进行测试。
(5)预测结果和概率。
首先需要引入pandas库
import pandas as pd 1
接着设置训练集和测试集并插入数据
train_data:训练集 test_data:测试集 """# numpy:数组形式来读取数据,pytorch:numpy。pandas:已表格的形式来读取数据, train_data = pd.read_excel("鸢尾花训练数据.xlsx") test_data = pd.read_excel("鸢尾花测试数据.xlsx") 12345 2.处理训练集数据,将数据重拍,变量与标签分离
train_X = train_data[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']] train_y = train_data['类型_num'] 12 3.标准化语法(归一化:0~1)
from sklearn.preprocessing import scale 1
对输入的数据进行减去均值并除以标准差的操作,从而将数据转换为均值为0、标准差为1的分布。这个操作可以使得不同特征之间的尺度一致,避免因为某些特征的尺度过大或者过小而影响模型的训练效果。
4.使用sklearn库中的KNN模块训练,再使用测试集数据进行测试from sklearn.neighbors import KNeighborsClassifier #【1~10】 knn = KNeighborsClassifier(n_neighbors=2) # knn.fit(data, train_y)#到这里训练就已经结束。 score= knn.score(data, train_y)#最总的分。 train_predicted = knn.predict(data) 12345678910111213
这里的k值是对准确率有影响的,我们可以带入不同的k
knn = KNeighborsClassifier(n_neighbors=1) knn = KNeighborsClassifier(n_neighbors=2) knn = KNeighborsClassifier(n_neighbors=3) knn = KNeighborsClassifier(n_neighbors=4) knn = KNeighborsClassifier(n_neighbors=5) knn = KNeighborsClassifier(n_neighbors=6) knn = KNeighborsClassifier(n_neighbors=7) knn = KNeighborsClassifier(n_neighbors=8) knn = KNeighborsClassifier(n_neighbors=9) knn = KNeighborsClassifier(n_neighbors=10) 1234567891011
使用测试集数据进行测试
test_X = test_data[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']] test_y = test_data[['类型_num']] 12 5.预测结果和概率
#预测结果 test_predicted = knn.predict(data_test) #预测概率 test_predicted_pr = knn.predict_proba(data_test) 12345
优点:
1.简单,易于实现,易于理解,无需练习;
2.适合对稀有事件进行分类;
3.对异常值不敏感。
缺点:
1.样本容量比较大时,计算时间很长;
2.不均衡样本效果较差。
相关知识
【机器学习】KNN算法实现鸢尾花分类
【机器学习】基于KNN算法实现鸢尾花数据集的分类
【机器学习】KNN算法实现手写板字迹识别
Knn算法实现鸢尾花分类
KNN算法实现鸢尾花数据集分类
机器学习分类算法SVM、逻辑回归、KNN
原生python实现knn分类算法(鸢尾花数据集)
【10月23日】机器学习实战(一)KNN算法:手写识别系统
机器学习之KNN算法及模型评估:鸢尾花分类实验
基于机器学习的鸢尾花数据集的三分类算法的实现 C++
网址: 机器学习:KNN算法实现对鸾尾花的分类 https://m.huajiangbk.com/newsview1354146.html
上一篇: 3、学习的一个例子:神经网络实现 |
下一篇: Tensorflow:softm |