首页 > 分享 > 【Python】芜湖市空气质量指数可视化(散点图、分类散点图、单变量分布图、线性回归拟合图、相关性热力图)

【Python】芜湖市空气质量指数可视化(散点图、分类散点图、单变量分布图、线性回归拟合图、相关性热力图)

【Python】芜湖市空气质量指数可视化

本文仅供学习参考,如有错误,还请指正!

一、简介

空气质量指数(Air Quality Index,AQI )简而言之就是能够对空气质量进行定量描述的数据。空气质量(Air Quality )的好坏反映了空气污染程度,它是依据空气中污染物浓度的高低来判断的。空气污染是一个复杂的现象,在特定的时间和地点,空气污染物浓度受到许多因素影响。
下图是安徽芜湖市2020年空气质量指数的部分数据,请使用所给数据完成下列任务。

image-20230503144511320

二、题目要求

(1)使用pandas库读取芜湖市2020年空气质量指数统计数据。

(2)绘制AQI和PM2.5的关系散点图。

(3)绘制空气质量等级分类散点图。

(4)绘制空气质量等级单变量分布图。

(5)绘制PM2.5与AQI的线性回归拟合图。

(6)计算相关系数。

(7)绘制特征相关性热力图。

三、输出结果

AQI和PM2.5的关系散点图

image-20230503144633410

绘制空气质量等级分类散点图

image-20230503144713886

绘制空气质量等级单变量分布图

image-20230503144735196

绘制PM2.5与AQI的线性回归拟合图

image-20230503144800026

计算相关系数

image-20230503144817846

绘制特征相关性热力图

image-20230503144832898

四、源代码

# 何壮壮 20302211009 import pandas as pd import seaborn as sn import matplotlib.pyplot as plt # 正常显示中文标签 plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['font.family'] = 'sans-serif' # 1、读取数据 aqi = pd.read_csv('aqi.csv', encoding='gbk') # ['日期', 'AQI', '质量等级', 'PM2.5含量(ppm)', 'PM10含量(ppm)', 'SO2含量(ppm)', # 'CO含量(ppm)', 'NO2含量(ppm)', 'O3_8h含量(ppm)'] # 绘制 aqi 和 pm2.5 的关系散点图 # 设置图像尺寸 plt.figure(figsize=(15, 10)) # 绘制散点图,横坐标为aqi数据的第二列,纵坐标为aqi数据的第四列 plt.scatter(aqi[aqi.columns[1]], aqi[aqi.columns[3]]) # 设置横轴标签为'AQI',字体大小为20 plt.xlabel('AQI', fontsize=20) # 设置纵轴标签为'PM2.5',字体大小为20 plt.ylabel('PM2.5', fontsize=20) # 设置图像标题为'芜湖市AQI和PM2.5的关系散点图',字体大小为25 plt.title('芜湖市AQI和PM2.5的关系散点图', fontsize=25) # 显示图像 plt.show() # 绘制空气质量等级分类散点图 # 设定画布大小 plt.figure(figsize=(15, 10)) # 绘制散点图,x轴:AQI数据,y轴:空气等级数据 sn.stripplot(x=aqi[aqi.columns[2]], y=aqi[aqi.columns[1]], data=aqi, jitter=True) # 设定x轴标签和字体大小 plt.xlabel('AQI', fontsize=20) # 设定y轴标签和字体大小 plt.ylabel('空气等级', fontsize=20) # 设定标题和字体大小 plt.title('芜湖市空气质量等级分类散点图', fontsize=25) # 显示图形 plt.show() # 绘制空气质量等级单变量分布图 # 绘制以第三列为 x 轴,数据来源为 aqi 的计数图 sn.countplot(x=aqi.columns[2], data=aqi) # 设置标题为“空气质量等级单变量分布图” plt.title("空气质量等级单变量分布图") # 设置 x 轴标签为“质量等级” plt.xlabel("质量等级") # 设置 y 轴标签为“频数” plt.ylabel("频数") # 显示图像 plt.show() # 绘制PM2.5与AQI的线性回归拟合图 # 调用seaborn库的regplot函数,将PM2.5含量(ppm)作为x轴,AQI作为y轴,数据源为aqi sn.regplot(x='PM2.5含量(ppm)', y='AQI', data=aqi) # 设定图表标题为 'PM2.5与AQI的线性回归拟合图' plt.title('PM2.5与AQI的线性回归拟合图') # 设定图表x轴标签为'PM2.5含量(ppm)' plt.xlabel('PM2.5含量(ppm)') # 设定图表y轴标签为'AQI' plt.ylabel('AQI') # 显示图表 plt.show() # 计算相关系数 # 计算相关系数并赋值给变量 corr corr = aqi[['AQI', 'PM2.5含量(ppm)', 'PM10含量(ppm)', 'SO2含量(ppm)', 'CO含量(ppm)', 'NO2含量(ppm)', 'O3_8h含量(ppm)']].corr() print("AQI与其他因素的相关系数如下:n", corr) # 绘制特征相关性热力图 # 设置画布大小 plt.figure(figsize=(17, 14)) # 计算相关系数并赋值给变量 corr corr = aqi[['AQI', 'PM2.5含量(ppm)', 'PM10含量(ppm)', 'SO2含量(ppm)', 'CO含量(ppm)', 'NO2含量(ppm)', 'O3_8h含量(ppm)']].corr() # 以热图的形式展示相关性,并用蓝红色调表示,同时在每个方格中显示数值,并设置线宽为1 sn.heatmap(corr, cmap='RdBu_r', annot=True, linewidths=1) # 设置热图的标题,并设置字体大小为25 plt.title("各污染物之间的特征相关性热力分布图", fontsize=25) # 设置x轴标签字体大小为15 plt.xticks(fontsize=15) # 设置y轴标签字体大小为15 plt.yticks(fontsize=15) # 展示画布 plt.show()

python

运行

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990

相关知识

【Python】芜湖市空气质量指数可视化(散点图、分类散点图、单变量分布图、线性回归拟合图、相关性热力图)
实验四 Seaborn绘图(关系图、分类图、回归图的绘制)
seaborn可视化
鸢尾花数据集可视化分析:柱状图、热力图、散点图与更多
Seaborn数据可视化案例精讲(20年经验总结):从入门到项目落地全路径
鸢尾花数据集如何可视化
python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析
【数据可视化系列】使用Python和Seaborn绘制相关性热力图
Pandas入门篇(三)
鸢尾花分类与直方图、散点图的绘制及可视化决策树

网址: 【Python】芜湖市空气质量指数可视化(散点图、分类散点图、单变量分布图、线性回归拟合图、相关性热力图) https://m.huajiangbk.com/newsview2583333.html

所属分类:花卉
上一篇: 陈松蹊团队发表论文揭示气象变量对
下一篇: PM2.5和PM10有什么不同?