预备工作
数据集
数据集:资料,提取码:hywg
导包
import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib 12345
数据集导入、划分
# 导入鸢尾花数据集 df = pd.read_csv('iris.csv', index_col=0,header=0,names=[0,1,2,3,'Species']) # 划分数据集 grouped = df[list(range(4))].groupby(df['Species']) setosa = grouped.get_group('setosa') versicolor = grouped.get_group('versicolor') virginica = grouped.get_group('virginica') # 索引重排 versicolor.reset_index(drop=True,inplace=True) virginica.reset_index(drop=True,inplace=True) 1234567891011
折线图
# 折线图 每个种类的Sepal.Length折线图 tmp = pd.DataFrame({'setosa':setosa[0],'versicolor':versicolor[0],'virginica':virginica[0]}) tmp.plot() plt.show() 1234
柱状图
# 柱状图 每个种类的平均值柱状图 bar = grouped.mean() bar.plot.bar() plt.show() 1234
散点图
# 不同种类的鸢尾花的Sepals分布 ax = setosa.plot.scatter(x=0, y=1, color='DarkBlue', label='setosa'); bx = versicolor.plot.scatter(x=0, y=1, color='DarkGreen', label='versicolor', ax=ax); virginica.plot.scatter(x=0, y=1, color='DarkRed', label='virginica', ax=bx); plt.show() 12345