以鸢尾花数据集为例,记录常用的数据可视化方法。
使用plt.rcParams 方法解决PyCharm所创建图表中中文无法显示的问题。
通常使用柱状图分析单个变量的分布情况
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import missingno as msno
import warnings
warnings.filterwarnings("ignore")
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
Iris = pd.read_csv("D:Py_MLdataIris.csv")
Iris2 = Iris.drop(["Id", "Species"], axis=1)
print(Iris2.head())
print("均值:n", Iris2.mean())
print("中位数:n", Iris2.median())
plt.figure(figsize=(10,6))
plt.hist(Iris2.PetalLengthCm,bins=30, color="blue")
plt.xlabel("PetalLengthCm")
plt.ylabel("PetalLengthCm的分布")
plt.title("Hist")
通常使用热力图,分析多个变量之间的相关性:
#热力图:了解变量之间的相关性
iriscorr = Iris2.corr(method="pearson")
#使用热力图可视化
plt.figure(figsize=(8,6))
ax = sns.heatmap(iriscorr, fmt = ".3f", annot = True, cmap = "YlGnBu")
ax.set_yticklabels(iriscorr.index.values,va="center")
plt.title("Iris HeatMap")
Fig 1 热力图
图中数值范围为[-1,1],数值越接近1,表示两个变量越正相关,反之,越接近-1,说明连个变量越负相关。
# 散点图:两个变量之间的关系
plt.figure(figsize=(10, 6))
sns.scatterplot(x="SepalLengthCm", y="SepalWidthCm", data=Iris2, s=50)
plt.title('散点图')
plt.grid()
Fig 3 散点图
气泡图用于表示三个变量之间的关系,横、纵坐标和气泡的大小,各表示一个变量。
## 气泡散点图:观察三个变量之间的关系
plt.figure(figsize = (12,8))
sns.scatterplot(x = "PetalWidthCm",y = "SepalWidthCm",data = Iris2,
size = "SepalLengthCm",sizes = (20,400))
plt.title("buble")
plt.legend(loc="center right",bbox_to_anchor=(1.3, 0.5))
Fig 4 气泡图
表示多个变量之间的分布情况的对比,主要看是否存在异常值。
#分组箱线图:观察多个数据的异常值分布情况
print(Iris.head())
print("nIrislong")
Irislong=Iris.melt(["Id","Species"],var_name="Measurement_type",value_name="value")
plt.figure(figsize=(10,6))
sns.boxplot(data = Irislong,x = "Measurement_type",y = "value",hue = "Species")
plt.legend(loc = 1)
plt.title("分组箱线图")
print(Irislong.head())
plt.show()
Fig 5 分组箱体图
相关知识
鸢尾花数据集如何可视化
鸢尾花数据集,揭开数据可视化分析的奥秘
数据可视化——鸢尾花数据集的分析与散点图的绘制
python 怎么加载鸢尾花数据
鸢尾花数据集降维可视化
鸢尾花数据集的数据可视化
【机器学习】任务二:波士顿房价的数据与鸢尾花数据分析及可视化
Python数据分析项目实例3:使用matplotlib散点图分析鸢尾花(Iris)数据集
常用大数据可视化分析工具介绍
python 鸢尾花数据集下载
网址: 鸢尾花数据集可视化分析:柱状图、热力图、散点图与更多 https://m.huajiangbk.com/newsview1548741.html
上一篇: 探秘《抽样花》:一个创新的数据可 |
下一篇: 【可视化】鸢尾花(iris)数据 |