首页 > 分享 > 不错吧,这5种方法可以轻松美化Pandas数据图表

不错吧,这5种方法可以轻松美化Pandas数据图表

大家好,我总是相信好的想法都是靠思想交流碰撞中获取的,最近一位微信群网友感慨:pandas做数据太单调了。结果另一位给出了这么漂亮的解决方案。我们一起来欣赏一下,文末可以加入我们的技术交流群。

我们知道 Pandas 是一种高效的数据处理库,它以dataframe和series为基本数据类型,呈现出类似excel的二维数据。

在Jupyter中,会美化Pandas的输出。不同于IDE展示的文本形式,Jupyter可以通过CSS修改表格的样式。

我们在做excel表格的时候,常常会对重要数据进行highlight,或者用不同颜色表示数据的大小。这在Pandas中也是可以实现的,而且非常简洁。图片

Pandas提供了DataFrame.style属性,它会返回Styler对象,用以数据样式的美化。图片

一般的,我们需要将样式函数作为参数传递到下面方法中,就可以实现图表美化。

Styler.applymap: 作用于元素

Styler.apply:作用于行、列或整个表

下面通过一些例子,具体展示常用的美化形式。

一、高亮显示

为便于展示,数据示例是用的2021世界人口数量前十国家数据

import pandas as pd data = pd.read_excel(r"E:jupyter_notebook2021世界人口数据.xlsx") data 123

图片

我们先看下该表的信息:

data.info() 1

图片

除了前两列,其他列都为数字类型。

现在对指定列的最大值进行高亮处理:

def highlight_max(s): ''' 对列最大值高亮(黄色)处理 ''' is_max = s == s.max() return ['background-color: yellow' if v else '' for v in is_max] data.style.apply(highlight_max,subset=['2021人口', '2020人口', '面积','单位面积人口','人口增幅','世界占比']) 12345678

图片

如果不想对元素背景高亮处理,也可以直接更改指定元素颜色,从而达到突出重点的目的。

标记单位面积人口列大于200的元素:

def color_red(s): is_max = s > 200 return ['color : red' if v else '' for v in is_max] data.style.apply(color_red,subset=['单位面积人口']) 12345

图片

二、数据条显示

Excel条件格式里,有一个数据条显示方式,用以可视化表达数据大小。

Pandas Style方法中也有数据条的表达形式,用df.style.bar来实现。

还是用前面人口数据的例子,我们来看下如何操作数据条。

import pandas as pd data = pd.read_excel(r"E:jupyter_notebook2021世界人口数据.xlsx") # 数据条显示指定列数据大小 data.style.bar(subset=['2021人口', '2020人口'], color='#FFA500') 1234

图片

三、色阶显示

色阶也就是热力图,它和数据条一样,都用来表达数据大小。

Pandas Style中色阶的使用也很简单,用df.style.background_gradient实现。

import seaborn as sns # 使用seaborn获取颜色 cm = sns.light_palette("green", as_cmap=True) # 色阶实现 data.style.background_gradient(cmap=cm,subset=['2021人口', '2020人口', '面积','单位面积人口','人口增幅','世界占比']) 123456

图片

可以通过选择最大最小颜色比例,调节色阶范围。

调节前:

import seaborn as sns # 色阶实现,这里使用内置色阶类型,不调节颜色范围 data.style.background_gradient(cmap='viridis',high=0.2,low=0.1,subset=['2021人口', '2020人口', '面积','单位面积人口','人口增幅','世界占比']) 1234

图片

调节后:

import seaborn as sns # 色阶实现,这里使用内置色阶类型,调节颜色范围 data.style.background_gradient(cmap='viridis',high=0.5,low=0.3,subset=['2021人口', '2020人口', '面积','单位面积人口','人口增幅','世界占比']) 1234

图片

四、百分比显示

有些数字需要百分比显示才能准确表达,比如说人口数据里的人口增幅、世界占比。

Pandas可以数据框中显示百分比,通过Styler.format来实现。

data.style.format("{:.2%}",subset=['人口增幅','世界占比']) 1

图片

五、标记缺失值

数据集中可能会存在缺失值,如果想突出显示缺失值,该怎么操作?

这里有好几种常用的方法,一是用-符号替代,二是高亮显示

先创建一个带缺失值的表,还是用人口数据。

import pandas as pd import numpy as np data = pd.read_excel(r"E:jupyter_notebook2021世界人口数据.xlsx") data.iloc[1, 4] = np.nan data.iloc[3, 1] = np.nan data.iloc[6, 6] = np.nan data 1234567

图片

上面数据中有三个缺失值,我们用-符号替代缺失值:

data.style.format(None, na_rep="-") 1

图片

再试试对缺失值高亮显示:

data.style.highlight_null(null_color='red') 1

图片

附:将样式输出到excel

Pandas中的数据美化样式不仅可以展示在notebook中,还可以输出到excel。

这里使用to_excel方法,并用openpyxl作为内核

import pandas as pd import numpy as np data = pd.read_excel(r"E:jupyter_notebook2021世界人口数据.xlsx") data.style.background_gradient(cmap='viridis',subset=['2021人口', '2020人口', '面积','单位面积人口','人口增幅','世界占比']). to_excel('style.xlsx', engine='openpyxl') 12345

图片

技术交流

欢迎转载、收藏、有所收获点赞支持一下!

目前开通了技术交流群,群友已超过1000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

方式①、发送如下图片至微信,长按识别,后台回复:加群;方式②、添加微信号:dkl88191,备注:CSDN+研究方向方式③、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

在这里插入图片描述

相关知识

【Python】—— pandas 数据分析
使用pandas绘制两列csv的直方图
Matplotlib基础04:使用Pandas绘制鸢尾花数据集
Pandas入门与进阶
鸢尾数据分析用什么工具
如何在Python中使用Pandas库进行季节性调整?
数据分析软件工具有哪些免费使用
python数据分析pandas画图
鸢尾花数据集如何可视化
pandas删除数据操作(空行,去重)

网址: 不错吧,这5种方法可以轻松美化Pandas数据图表 https://m.huajiangbk.com/newsview1545107.html

所属分类:花卉
上一篇: MFC界面美化第五篇(汇总篇)
下一篇: 数据处理:matplotlib应