首页 > 分享 > 机器学习：KNN算法实现对鸾尾花的分类

机器学习：KNN算法实现对鸾尾花的分类

花匠小妙招
2024-12-29 12:56

使用knn算法对鸢尾花数据进行分类，分类过程如下：

（1）将鸾尾花数据分为训练集和测试集，用来读取数据。
（2）处理训练集数据，将数据重拍，变量与标签分离。
（3）标准化语法（归一化：0~1）
（4）使用sklearn库中的KNN模块训练，再使用测试集数据进行测试。
（5）预测结果和概率。

1.训练集和测试集

首先需要引入pandas库

import pandas as pd 1

接着设置训练集和测试集并插入数据

train_data:训练集 test_data:测试集 """# numpy：数组形式来读取数据，pytorch：numpy。pandas：已表格的形式来读取数据， train_data = pd.read_excel("鸢尾花训练数据.xlsx") test_data = pd.read_excel("鸢尾花测试数据.xlsx") 12345 2.处理训练集数据，将数据重拍，变量与标签分离

train_X = train_data[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']] train_y = train_data['类型_num'] 12 3.标准化语法（归一化：0~1）

from sklearn.preprocessing import scale 1

对输入的数据进行减去均值并除以标准差的操作，从而将数据转换为均值为0、标准差为1的分布。这个操作可以使得不同特征之间的尺度一致，避免因为某些特征的尺度过大或者过小而影响模型的训练效果。

4.使用sklearn库中的KNN模块训练，再使用测试集数据进行测试

from sklearn.neighbors import KNeighborsClassifier #【1~10】 knn = KNeighborsClassifier(n_neighbors=2) # knn.fit(data, train_y)#到这里训练就已经结束。 score= knn.score(data, train_y)#最总的分。 train_predicted = knn.predict(data) 12345678910111213

这里的k值是对准确率有影响的，我们可以带入不同的k

knn = KNeighborsClassifier(n_neighbors=1) knn = KNeighborsClassifier(n_neighbors=2) knn = KNeighborsClassifier(n_neighbors=3) knn = KNeighborsClassifier(n_neighbors=4) knn = KNeighborsClassifier(n_neighbors=5) knn = KNeighborsClassifier(n_neighbors=6) knn = KNeighborsClassifier(n_neighbors=7) knn = KNeighborsClassifier(n_neighbors=8) knn = KNeighborsClassifier(n_neighbors=9) knn = KNeighborsClassifier(n_neighbors=10) 1234567891011

使用测试集数据进行测试

test_X = test_data[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']] test_y = test_data[['类型_num']] 12 5.预测结果和概率

#预测结果 test_predicted = knn.predict(data_test) #预测概率 test_predicted_pr = knn.predict_proba(data_test) 12345