首页 > 分享 > 自带的数据集

自带的数据集

同学们你们好,猫老师又来更新了,我们在做数据分析的这个过程中,所用的数据集可以来源于实际的案例,也可以从网上寻找公开的数据资源,当然也可以编码生成一个随机数据集。本章采用Python的Sklearn机器学习库中自带的数据集——鸢尾花数据集。简单分析数据集之间特征的关系图,根据花瓣长度、花瓣宽度、花萼长度、花萼宽度四个特征进行绘图。

Iris plants data set数据集可以从Sklearn包里面直接拿到,也可以从KEEL dataset数据集网站获取。数据集共包含4个特征变量、1个类变量,一共有150个样本。类别变量分别对应鸢尾花的三个亚属,分别是山鸢尾 (Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

数据可视化可以更好地了解数据,主要调用Pandas扩展包进行绘图操作。

首先绘制直方图,直观的表现花瓣、花萼的长和宽特征的数量,纵坐标表示汇总的数量,横坐标表示对应的长度。

import pandas

#导入数据集iris

url = "https://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data"

names = ['sepal-length', 'sepal-width', 'petal-length', 'petal-width', 'class']

dataset = pandas.read_csv(url, names=names) #读取csv数据

print

相关知识

MATLAB鸢尾花数据集(iris.txt)
常用数据集
数据集划分,Oxford Flower102花卉分类数据集,分为训练集、测试集、验证集
5种 flowerdata数据集
鸢尾花数据集下载
分析鸢尾花数据集
植物病害识别数据集
使用YOLOv8训练该数据集农业害虫检测数据集 农业虫害数据集.该数据集的害虫类别共为三类,该数据集共4010张JPG图片,标签文件为xml格式,4010个。
花卉数据集
各种病虫害的高清数据集

网址: 自带的数据集 https://m.huajiangbk.com/newsview545947.html

所属分类:花卉
上一篇: 上海沪工(603131)个股资金
下一篇: 数据分析面试、笔试题汇总+解析(