首页 > 分享 > 《Python机器学习基础教程》学习笔记(1) 鸢尾花分类

《Python机器学习基础教程》学习笔记(1) 鸢尾花分类

最新推荐文章于 2024-11-22 23:54:06 发布

坤斤拷 于 2019-02-02 18:59:10 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

引言

鸢尾花分类是《Python机器学习基础教程》中的第一个应用,是一个监督学习问题,概述了使用scikit-learn库进行监督学习的基本流程:

获取数据→数据集拆分→观察数据→构建模型→评估模型→预测

博主使用的编程环境:

Sublime Text 3 + Jupyter Notebook + Anaconda 3

默认导入库:

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import mglearn

#博主使用的Anaconda 3并未默认安装mglearn,需要打开anaconda prompt输入pip install mglearn进行安装

 

应用

一 获取数据

鸢尾花(Iris)数据集是机器学习和统计学中的一个经典数据集,包含于scikit-learn的datasets模块中,可调用load_iris()来导入:

from sklearn.datasets import load_iris

iris_dataset = load_iris()

load_iris()返回的是一个Bunch对象,有五个键:

①target_names: 鸢尾花的三个品种

②feature_names: 鸢尾花的四个特征

③DESCR: 对数据集的简要说明

④data: 鸢尾花四个特征的具体数据

⑤target: 鸢尾花的品种,由0,1,2来表示

二 数据集拆分

通常我们将数据用大写的X来表示(因为数据是个二维数组),而标签用小写的y来表示

然后利用scikit-learn的train_test_split()将导入的数据集分为训练集(用于构建机器学习模型)与测试集(用于评估模型性能),通常采用3:1的随机分配方法。train_test_split()的随机种子每次执行都会改变,为了使结果可以验证,我们可以通过random_state设置固定的随机种子。

from

相关知识

Python机器学习基础教程
[Python机器学习]鸢尾花分类 机器学习应用
Python机器学习基础教程——1.7第一个应用:鸢尾花分类——学习笔记
机器学习案例:鸢尾花分类——基于Scikit
[机器学习基础][笔记] 一、鸢尾花分类
机器学习入门实践——鸢尾花分类
机器学习笔记(通俗易懂)
机器学习鸢尾花数据集
python机器学习
【机器学习】鸢尾花分类

网址: 《Python机器学习基础教程》学习笔记(1) 鸢尾花分类 https://m.huajiangbk.com/newsview1254883.html

所属分类:花卉
上一篇: 机器学习入门(一) 之 K近邻算
下一篇: numpy基础用法