Iris数据集包含有四个属性一个标签
四个属性分别是
一个标签,用来说明是哪一种鸢尾花
山鸢尾(Setosa)变色鸢尾(versicolor)维吉尼亚鸢尾(virginica)任意两个不同的属性组合,查看散点图上不同鸢尾花的分布情况
第一行文件不是数据集的内容,而是总体的一个统计信息
表示有120个数据样本,4个属性和3种不同的鸢尾花花名
代码1:
import matplotlib.pyplot as plt import numpy as np import tensorflow as tf import pandas as pd plt.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 指定默认字体 plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题 # 下载鸢尾花数据集 TRAIN_URL = r'http://download.tensorflow.org/data/iris_training.csv' train_path = tf.keras.utils.get_file(TRAIN_URL.split('/')[-1],TRAIN_URL) # 加载鸢尾话数据集 names = ['Sepal length','Sepal width','Petal length','Petal width','Species'] # 选择第一行作为列标题,然后再用names作为新的列标题覆盖掉原先的列标题 df_iris = pd.read_csv(train_path,header=0,names=names) iris_data = df_iris.values plt.figure(figsize=(15,15),dpi=60) for i in range(4): for j in range(4): plt.subplot(4,4,i*4+j+1) if i==0: plt.title(names[j]) if j==0: plt.ylabel(names[i]) if i == j: plt.text(0.3,0.4,names[i],fontsize = 15) continue plt.scatter(iris_data[:,j],iris_data[:,i],c= iris_data[:,-1],cmap='brg') plt.tight_layout(rect=[0,0,1,0.9]) plt.suptitle('鸢尾花数据集nBule->Setosa | Red->Versicolor | Green->Virginica', fontsize = 20) plt.show()
123456789101112131415161718192021222324252627282930313233343536或者代码2:
import matplotlib.pyplot as plt import numpy as np import tensorflow as tf import pandas as pd plt.rcParams['font.sans-serif'] = ['Microsoft YaHei'] # 指定默认字体 plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题 # 下载鸢尾花数据集 TRAIN_URL = r'http://download.tensorflow.org/data/iris_training.csv' train_path = tf.keras.utils.get_file(TRAIN_URL.split('/')[-1],TRAIN_URL) # 加载鸢尾话数据集 names = ['Sepal length','Sepal width','Petal length','Petal width','Species'] # 选择第一行作为列标题,然后再用names作为新的列标题覆盖掉原先的列标题 df_iris = pd.read_csv(train_path,header=0,names=names) iris_data = df_iris.values plt.figure(figsize=(15,15),dpi=60) for i in range(4): for j in range(4): plt.subplot(4,4,i*4+j+1) if i==0: plt.title(names[j]) if j==0: plt.ylabel(names[i]) if i == j: plt.text(0.3,0.4,names[i],fontsize = 15) continue color = 'brg' for index in range(3): plt.scatter(iris_data[:,j][iris_data[:,-1]==index],iris_data[:,i][iris_data[:,-1]==index],color=color[index]) plt.tight_layout(rect=[0,0,1,0.9]) plt.suptitle('鸢尾花数据集nBule->Setosa | Red->Versicolor | Green->Virginica', fontsize = 20) plt.show()
1234567891011121314151617181920212223242526272829303132333435363738相关知识
鸢尾花数据集可视化分析
基于Echarts的鸢尾花数据可视化
鸢尾花数据集下载
分析鸢尾花数据集
【机器学习】经典数据集鸢尾花的分类识别
机器学习之路:经典的鸢尾花数据集
基于Logistic回归模型对鸢尾花数据集的线性多分类
对鸢尾花数据集和月亮数据集,分别采用线性LDA、k
【机器学习实战】科学处理鸢尾花数据集
【python机器学习】KNN算法实现回归(基于鸢尾花数据集)
网址: 鸢尾花数据集可视化 https://m.huajiangbk.com/newsview545938.html
上一篇: 用Python做股市数据分析(二 |
下一篇: k均值聚类分析鸢尾花数据集 |