鸢尾花逻辑回归实验报告重点难点逻辑回归鸢尾花分类

转载

如果你也想自学机器学习，可以关注我。我会把踩过的坑分享给你，相关的教程以及配套的讲解，分享给大家：

https://edu.51cto.com/lesson/1001824.html

利用逻辑回归进行鸢尾花分类

数据集处理数据可视化模型训练

首先导入我们所需要用到的库

1.数据集导入

要训练模型，首先要处理数据集，我们使用的数据集是sklearn中的鸢尾花数据集，该数据集一共有四个特征变量，一个目标分类变量，共有150个样本。

变量

描述

sepal length

花萼长度(cm)

sepal width

花萼宽度(cm)

petal length

花瓣长度(cm)

petal width

花瓣宽度(cm)

target

鸢尾的三个亚属类别,‘setosa’(0), ‘versicolor’(1), ‘virginica’(2)

当我们拿到数据集后首先要看这个数据集的大致情况，都有什么特征，以及有没有缺失值，如果有缺失值就要对缺失值进行处理。从上面我们可以看到，这个数据集并没有缺失值，因此不需要进行缺失值处理。

查看数据集的前五行

查看标签，0，1，2分布代表不同类别的鸢尾花。

2.数据可视化

在训练数据之前，我们先在图中查看一下该数据集

在这里为了避免我们在可视化的过程中不小心修改到原数据，这里我们对原数据进行一下拷贝

箱型图绘制

三维散点图绘制

3.利用逻辑回归模型，在二分类任务上进行训练和预测

这里我们做的是二分类，因此我们在样本数据集中选择两种鸢尾花的数据进行训练

在训练集和测试集上分别利用训练好的模型进行预测

从上面的结果我们可以看到，无论是在训练集还是测试集，我们的预测值和实际值是一样的。接下来我们用利用accuracy（准确度)评估模型效果

精确度指的是 预测正确的样本数目占总预测样本数目的比例

accuracy也有缺点，就是在样本不平衡的情况下并不能作为很好的指标来衡量结果

这里accuracy的值是1，我们在上面测试的结果是一致的。

如果你也想自学机器学习，可以关注我。我会把踩过的坑分享给你，相关的教程以及配套的讲解，分享给大家：

https://edu.51cto.com/lesson/1001824.html

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

相关文章

鸢尾花逻辑回归实验报告重点难点逻辑回归鸢尾花分类