机器学习入门实践——鸢尾花分类

©著作权归作者所有：来自51CTO博客作者流楚丶格念的原创作品，请联系作者获取转载授权，否则将追究法律责任

文章目录

原数据地址：任务描述：数据集 Step1.数据准备 Step2.模型搭建 Step3.模型训练 Step4.模型评估 Step5.模型使用

原数据地址：

https://aistudio.baidu.com/aistudio/projectdetail/1096669

任务描述：

构建一个模型，根据鸢尾花的花萼和花瓣大小将其分为三种不同的品种。

数据集

总共包含150行数据

每一行数据由 4 个特征值及一个目标值组成。

4 个特征值分别为：萼片长度、萼片宽度、花瓣长度、花瓣宽度

目标值为三种不同类别的鸢尾花，分别为： Iris Setosa、Iris Versicolour、Iris Virginica

首先导入必要的包：

numpy：python第三方库，用于科学计算

matplotlib:python第三方库，主要用于进行可视化

sklearn:python的重要机器学习库，其中封装了大量的机器学习算法，如：分类、回归、降维以及聚类

Step1.数据准备

(1)从指定路径下加载数据

(2)对加载的数据进行数据分割，x_train,x_test,y_train,y_test分别表示训练集特征、训练集标签、测试集特征、测试集标签

Step2.模型搭建

C越大，相当于惩罚松弛变量，希望松弛变量接近0，即对误分类的惩罚增大，趋向于对训练集全分对的情况，这样对训练集测试时准确率很高，但泛化能力弱。
C值小，对误分类的惩罚减小，允许容错，将他们当成噪声点，泛化能力较强。

kernel='linear’时，为线性核

decision_function_shape='ovr’时，为one v rest，即一个类别与其他类别进行划分，

decision_function_shape='ovo’时，为one v one，即将类别两两之间进行划分，用二分类的方法模拟多分类的结果。

Step3.模型训练

Step4.模型评估

Step5.模型使用

赞收藏评论举报

相关文章

机器学习入门实践——鸢尾花分类