鸢尾花逻辑回归实验报告重点难点 逻辑回归鸢尾花分类
转载
如果你也想自学机器学习,可以关注我。我会把踩过的坑分享给你,相关的教程以及配套的讲解 ,分享给大家:
https://edu.51cto.com/lesson/1001824.html
利用逻辑回归进行鸢尾花分类
数据集处理数据可视化模型训练首先导入我们所需要用到的库
1.数据集导入
要训练模型,首先要处理数据集,我们使用的数据集是sklearn中的鸢尾花数据集,该数据集一共有四个特征变量,一个目标分类变量,共有150个样本。
变量
描述
sepal length
花萼长度(cm)
sepal width
花萼宽度(cm)
petal length
花瓣长度(cm)
petal width
花瓣宽度(cm)
target
鸢尾的三个亚属类别,‘setosa’(0), ‘versicolor’(1), ‘virginica’(2)
当我们拿到数据集后首先要看这个数据集的大致情况,都有什么特征,以及有没有缺失值,如果有缺失值就要对缺失值进行处理。从上面我们可以看到,这个数据集并没有缺失值,因此不需要进行缺失值处理。
查看数据集的前五行
查看标签,0,1,2分布代表不同类别的鸢尾花。
2.数据可视化
在训练数据之前,我们先在图中查看一下该数据集
在这里为了避免我们在可视化的过程中不小心修改到原数据,这里我们对原数据进行一下拷贝
箱型图绘制
三维散点图绘制
3.利用逻辑回归模型,在二分类任务上进行训练和预测
这里我们做的是二分类,因此我们在样本数据集中选择两种鸢尾花的数据进行训练
在训练集和测试集上分别利用训练好的模型进行预测
从上面的结果我们可以看到,无论是在训练集还是测试集,我们的预测值和实际值是一样的。接下来我们用利用accuracy(准确度)评估模型效果
精确度指的是 预测正确的样本数目占总预测样本数目的比例
accuracy也有缺点,就是在样本不平衡的情况下并不能作为很好的指标来衡量结果
这里accuracy的值是1,我们在上面测试的结果是一致的。
如果你也想自学机器学习,可以关注我。我会把踩过的坑分享给你,相关的教程以及配套的讲解 ,分享给大家:
https://edu.51cto.com/lesson/1001824.html
本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
相关文章