首页 > 分享 > 基于鸢尾花(iris)数据集的回归分类实践——二分类及多分类

基于鸢尾花(iris)数据集的回归分类实践——二分类及多分类

鸢尾花数据集概括。
本次我们选择鸢花数据(iris)进行方法的尝试训练,该数据集一共包含5个变量,其中4个特征变量,1个目标分类变量。共有150个样本,目标变量为 花的类别 其都属于鸢尾属下的三个亚属,分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。包含的三种鸢尾花的四个特征,分别是花萼长度(cm)、花萼宽度(cm)、花瓣长度(cm)、花瓣宽度(cm),这些形态特征在过去被用来识别物种。
在这里插入图片描述
代码部分

导入库

## 基础函数库 import numpy as np import pandas as pd ## 绘图函数库 import matplotlib.pyplot as plt import seaborn as sns 1234567

数据读取/载入

## 我们利用 sklearn 中自带的 iris 数据作为数据载入,并利用Pandas转化为DataFrame格式 from sklearn.datasets import load_iris data = load_iris() #得到数据特征 iris_target = data.target #得到数据对应的标签 iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式 12345

浏览数据

## 利用.info()查看数据的整体信息 iris_features.info() 12

<class 'pandas.core.frame.DataFrame'> RangeIndex: 150 entries, 0 to 149 Data columns (total 4 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 sepal length (cm) 150 non-null float64 1 sepal width (cm) 150 non-null float64 2 petal length (cm) 150 non-null float64 3 petal width (cm) 150 non-null float64 dtypes: float64(4) memory usage: 4.8 KB 1234567891011

## 利用.head() 查看头部数据 iris_features.head() 12

sepal length (cm)sepal width (cm)petal length (cm)petal width (cm) 05.1 3.5 1.4 0.2 14.9 3.0 1.4 0.2 24.7 3.2 1.3 0.2 34.6 3.1 1.5 0.2 45.0 3.6 1.4 0.2 123456

# 利用.tail()尾部 查看头部数据 iris_features.tail() 12

sepal length (cm)sepal width (cm)petal length (cm)petal width (cm) 145 6.7 3.0 5.2 2.3 146 6.3 2.5 5.0 1.9 1476.5 3.0 5.2 2.0 148 6.2 3.4 5.4 2.3 149 5.9 3.0 5.1 1.8 123456

## 其对应的类别标签为,其中0,1,2分别代表'setosa', 'versicolor', 'virginica'三种不同花的类别。 iris_target 12

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2]) 1234567

## 利用value_counts函数查看每个类别数量 pd.Series(iris_target).value_counts() 12

2 50 1 50 0 50 dtype: int64 1234

## 对于特征进行一些统计描述 iris_features.describe() 12

sepal length (cm)sepal width (cm)petal length (cm)petal width (cm) count150.000000 150.000000 150.000000 150.000000 mean5.843333 3.057333 3.758000 1.199333 std 0.828066 0.435866 1.765298 0.762238 min 4.300000 2.000000 1.000000 0.100000 25% 5.100000 2.800000 1.600000 0.300000 50% 5.800000 3.000000 4.350000 1.300000 75%6.400000 3.300000 5.100000 1.800000 max 7.900000 4.400000 6.900000 2.500000 123456789

可视化

## 合并标签和特征信息 iris_all =1

相关知识

基于鸢尾花(iris)数据集的逻辑回归分类实践
基于Logistic回归模型对鸢尾花数据集的线性多分类
基于KNN的鸢尾花分类
鸢尾花、葡萄酒分类数据集
【机器学习】利用逻辑回归对iris鸢尾花数据集进行分类
基于机器学习的鸢尾花数据集的三分类算法的实现 C++
第3章(下)基于Softmax回归完成鸢尾花分类任务
python鸢尾花数据集的分类问题 -- 逻辑回归问题研究
逻辑回归鸢尾花分类可视化
Python实现Logistc回归分类(西瓜数据集、鸢尾花数据集)详解

网址: 基于鸢尾花(iris)数据集的回归分类实践——二分类及多分类 https://m.huajiangbk.com/newsview1842732.html

所属分类:花卉
上一篇: python机器学习 鸢尾花分类
下一篇: python鸢尾花数据集机器学习