Seaborn
Seaborn其实是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,
在大多数情况下使用seaborn就能做出很具有吸引力的图,而使用matplotlib能制作具有更多特色的图。
应该把Seaborn视为matplotlib的补充,而不是替代物。
import matplotlib.pyplot as plt # 使用import导入模块matplotlib.pyplot,并简写成plt
import numpy as np # 使用import导入模块numpy,并简写成np
x = np.linspace(-1, 1, 50) # 使用np.linspace定义x:范围是(-1,1);个数是50.
y = 2*x + 1 # 仿真一维数据组(x ,y)表示曲线1.
plt.figure() # 使用plt.figure定义一个图像窗口.
plt.plot(x, y) # 使用plt.plot画(x ,y)曲线.
plt.title('fig1') # 设置标题
plt.show() # 使用plt.show显示图像.
调整名字和间隔
x = np.linspace(-3, 3, 50) # 使用np.linspace定义x:范围是(-3,3); 个数是50.
y1 = 2*x + 1 # 仿真一维数据组(x ,y1)表示曲线1.
y2 = x**2 # 仿真一维数据组(x ,y2)表示曲线2.
plt.figure() # 使用plt.figure定义一个图像窗口.
plt.plot(x, y2) # 使用plt.plot画(x ,y2)曲线.
# 使用plt.plot画(x ,y1)曲线,曲线的颜色属性(color)为红色;
# 曲线的宽度(linewidth)为1.0;
# 曲线的类型(linestyle)为虚线.
plt.plot(x, y1, color='red', linewidth=1.0, linestyle='--')
plt.xlim((-1, 2)) # 使用plt.xlim设置x坐标轴范围:(-1, 2);
plt.ylim((-2, 3)) # 使用plt.ylim设置y坐标轴范围:(-2, 3);
plt.xlabel('I am x') # 使用plt.xlabel设置x坐标轴名称:’I am x’;
plt.ylabel('I am y') # 使用plt.ylabel设置y坐标轴名称:’I am y’;
plt.show() #
# set line syles
l1, = plt.plot(x, y1, label='linear line')
l2, = plt.plot(x, y2, color='red', linewidth=1.0, linestyle='--', label='square line')
# legend将要显示的信息来自于上面代码中的 label. 所以我们只需要简单写下一下代码, plt 就能自动的为我们添加图例.
plt.legend(loc='upper right')
plt.show()
调整位置和名称
如果我们想单独修改之前的 label 信息, 给不同类型的线条设置图例信息.
我们可以在 plt.legend 输入更多参数. 如果以下面这种形式添加 legend,
我们需要确保, 在上面的代码 plt.plot(x, y2, label='linear line')
和
plt.plot(x, y1, label='square line')
中有用变量 l1 和 l2 分别存储起来.
而且需要注意的是 l1, l2,要以逗号结尾, 因为plt.plot() 返回的是一个列表.
l1, = plt.plot(x, y1, label='linear line')
l2, = plt.plot(x, y2, color='red', linewidth=1.0, linestyle='--', label='square line')
plt.legend(handles=[l1, l2], labels=['up', 'down'], loc='best')
plt.show()
我们使用diamonds 数据集进行数据探索
diamonds=pd.read_csv('https://raw.githubusercontent.com/huangchaosp/hc-blog-attachment/master/data/diamonds.csv')
通过head() 和 shape 查看数据的结构
diamonds.head()
如何在一幅图上体现多个维度:比如通过颜色
g = sns.FacetGrid(ds, hue='color', size=7.5)
g.map(plt.scatter, 'carat', 'price').add_legend()
plt.show()
# 分组查看
g=sns.FacetGrid(data=ds,col='color',col_wrap=3) # 这里相当于groupby
g=g.map(sns.distplot,'carat')
plt.show()
# The slices will be ordered and plotted counter-clockwise.
labels = 'Frogs', 'Hogs', 'Dogs', 'Logs' # 定义标签
sizes = [15, 30, 45, 10] # 每一块的比例
colors = ['yellowgreen', 'gold', 'lightskyblue', 'lightcoral'] # 每一块的颜色
explode = (0, 0.1, 0, 0) # 突出显示,这里仅仅突出显示第二块(即 'Hogs' )
plt.pie(sizes, explode=explode, labels=labels, colors=colors, autopct='%1.1f%%',
shadow=True, startangle=90)
plt.axis('equal') # 显示为圆(避免比例压缩为椭圆)
plt.show()
# pivot() 可以将dataframe转换为行列式矩阵 并指定每个元素的存储值
flights = flights.pivot(index='month', columns='year', values='passengers')
flights.head()
plt.figure(figsize=(10,6))
sns.heatmap(flights, fmt='d', linewidths=.5)
# fmt设置字体模式 linewidth设置每个小方格的间距 线宽
plt.show()