首页 > 分享 > pandas删除数据操作(空行,去重)

pandas删除数据操作(空行,去重)

最新推荐文章于 2024-11-06 19:48:31 发布

YPL_ZML 于 2019-06-24 23:17:25 发布

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

import pandas as pd # 加载数据 users = pd.read_excel('users.xlsx') # print(users) # 删除数据用drop # labels 指定删除的列或者行名称 # axis = 0 删除行 # axis = 1 删除列 # inplace = True 替换原来数据 data = users.drop(labels=['age','sex'], axis=1, inplace=True) print(users) 1234567891011121314

删除空值列

# 首先 整列为空,对于数据分析毫无意义 # pd.count()--->非空的数目 # drop -->删除空列 import pandas as pd # 加载数据 detail = pd.read_excel('meal_order_detail.xlsx') # print(detail.columns) columns = detail.columns # print(type(columns)) # for col in columns: # # print(col) # if (detail[col].count()) == 0:#全空列 # print(col) # detail.drop(labels=col, axis=1, inplace=True) # print(detail) col = detail.count() == 0 # print(col) length = len(col) # print(length) for i in range(length): if col[i]: detail.drop(labels=col.index[i],axis=1,inplace=True) print("detail 的形状:",detail.shape)

123456789101112131415161718192021222324252627282930313233

#删除空列
#数据去重
#相似度运算

# 删除数据 # drop() import pandas as pd # 去重 # pd.drop_duplicates() # 加载数据 detail = pd.read_excel('meal_order_detail.xlsx') # 单列数据去重 # print(detail.columns) # print(detail.shape) # data = detail[['counts','amounts']].drop_duplicates() # print(data.shape) # 多列数据去重 data1 = detail.drop_duplicates(subset=['counts', 'amounts'], inplace=True) print(data1.shape)

12345678910111213141516171819202122

相关知识

【Python】—— pandas 数据分析
Matplotlib基础04:使用Pandas绘制鸢尾花数据集
python数据分析pandas画图
如何在Python中使用Pandas库进行季节性调整?
使用pandas绘制两列csv的直方图
数据挖掘综合
python数据分析和可视化【2】鸢尾花数据分析
自带的数据集
朴素贝叶斯分类(鸢尾花数据集)
鸢尾数据分析用什么工具

网址: pandas删除数据操作(空行,去重) https://m.huajiangbk.com/newsview1235153.html

所属分类:花卉
上一篇: 番石榴播种时间和方法(附养护知识
下一篇: 对一只水蜜桃的多维追寻,源自一朵