首页 > 分享 > 鸢尾花数据集可视化分析:柱状图、热力图、散点图与更多

鸢尾花数据集可视化分析:柱状图、热力图、散点图与更多

以鸢尾花数据集为例,记录常用的数据可视化方法。

使用plt.rcParams 方法解决PyCharm所创建图表中中文无法显示的问题。

1、柱状图

通常使用柱状图分析单个变量的分布情况

import matplotlib.pyplot as plt

import pandas as pd

import seaborn as sns

import missingno as msno

import warnings

warnings.filterwarnings("ignore")

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False

Iris = pd.read_csv("D:Py_MLdataIris.csv")

Iris2 = Iris.drop(["Id", "Species"], axis=1)

print(Iris2.head())

print("均值:n", Iris2.mean())

print("中位数:n", Iris2.median())

plt.figure(figsize=(10,6))

plt.hist(Iris2.PetalLengthCm,bins=30, color="blue")

plt.xlabel("PetalLengthCm")

plt.ylabel("PetalLengthCm的分布")

plt.title("Hist")

2 热力图

通常使用热力图,分析多个变量之间的相关性:

#热力图:了解变量之间的相关性

iriscorr = Iris2.corr(method="pearson")

#使用热力图可视化

plt.figure(figsize=(8,6))

ax = sns.heatmap(iriscorr, fmt = ".3f", annot = True, cmap = "YlGnBu")

ax.set_yticklabels(iriscorr.index.values,va="center")

plt.title("Iris HeatMap")

Fig 1 热力图

图中数值范围为[-1,1],数值越接近1,表示两个变量越正相关,反之,越接近-1,说明连个变量越负相关。

3 散点图

# 散点图:两个变量之间的关系

plt.figure(figsize=(10, 6))

sns.scatterplot(x="SepalLengthCm", y="SepalWidthCm", data=Iris2, s=50)

plt.title('散点图')

plt.grid()

Fig 3 散点图

  

4 气泡图

气泡图用于表示三个变量之间的关系,横、纵坐标和气泡的大小,各表示一个变量。

## 气泡散点图:观察三个变量之间的关系

plt.figure(figsize = (12,8))

sns.scatterplot(x = "PetalWidthCm",y = "SepalWidthCm",data = Iris2,

size = "SepalLengthCm",sizes = (20,400))

plt.title("buble")

plt.legend(loc="center right",bbox_to_anchor=(1.3, 0.5))

Fig 4   气泡图

5 分组箱体图

表示多个变量之间的分布情况的对比,主要看是否存在异常值。

#分组箱线图:观察多个数据的异常值分布情况

print(Iris.head())

print("nIrislong")

Irislong=Iris.melt(["Id","Species"],var_name="Measurement_type",value_name="value")

plt.figure(figsize=(10,6))

sns.boxplot(data = Irislong,x = "Measurement_type",y = "value",hue = "Species")

plt.legend(loc = 1)

plt.title("分组箱线图")

print(Irislong.head())

plt.show()

Fig 5 分组箱体图 

相关知识

鸢尾花数据集如何可视化
鸢尾花数据集,揭开数据可视化分析的奥秘
数据可视化——鸢尾花数据集的分析与散点图的绘制
python 怎么加载鸢尾花数据
鸢尾花数据集降维可视化
鸢尾花数据集的数据可视化
【机器学习】任务二:波士顿房价的数据与鸢尾花数据分析及可视化
Python数据分析项目实例3:使用matplotlib散点图分析鸢尾花(Iris)数据集
常用大数据可视化分析工具介绍
python 鸢尾花数据集下载

网址: 鸢尾花数据集可视化分析:柱状图、热力图、散点图与更多 https://m.huajiangbk.com/newsview1548741.html

所属分类:花卉
上一篇: 探秘《抽样花》:一个创新的数据可
下一篇: 【可视化】鸢尾花(iris)数据