一个机器学习的小应用:鸢尾花分类
鸢尾花有很多种,我们今天具体分类三种:
1.山鸢尾:
维吉尼亚鸢尾:
变色鸢尾:
看的出来,每个都很beautiful,但又都不一样
然后本文数据集和部分代码来自百度飞桨平台:
https://aistudio.baidu.com/aistudio/projectdetail/449373?forkThirdPart=1
我们可以看到数据集是150行的5列的数据:
import numpy as np from matplotlib import colors from sklearn import svm from sklearn.svm import SVC from sklearn import model_selection import matplotlib.pyplot as plt import matplotlib as mpl #导入必要的库 #*************将字符串转为整型,便于数据加载*********************** def iris_type(s): it = { b'Iris-setosa':0, b'Iris-versicolor':1, b'Iris-virginica':2} return it[s] #将山鸢尾标为0 变色鸢尾花为1 维吉尼亚鸢尾花为2 #加载数据 data_path='/home/aistudio/data/data2301/iris.data' #数据文件的路径 data = np.loadtxt(data_path, #数据文件路径 dtype=float, #数据类型 delimiter=',', #数据分隔符 converters={ 4:iris_type}) #将第5列使用函数iris_type进行转换 第五列就是种类了 # print(data) #data为二维数组,data.shape=(150, 5) # print(data.shape) #数据分割 x, y = np.split(data, #要切分的数组 (4,), #沿轴切分的位置,第5列开始往后为y axis=1<
12345678910111213141516171819202122232425