seaborn更高效的统计图表制作工具

时间:2022-07-26
本文章向大家介绍seaborn更高效的统计图表制作工具,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

欢迎关注”生信修炼手册”!

seaborn是建立在matplotlib上的一个高度封装的模块,针对数据的统计学描述,统计了一系列相关的可视化功能。

在该模块中,针对常用的统计图表,分为了以下3大类别

1. relplot, 描述数据点之前的关联,可视化形式是散点图和折线图

2. displot, 描述数据点的分布,可视化形式包括直方图,密度曲线等

3. catplot, 描述分类变量的分布,可视化形式包括箱体图,柱状图,小提琴图等

三大类别下面,是各自对应的具体类别。其实三大类别是其子类的更高等级封装,通过三大类别对应的函数,可以灵活调用子类的函数。

来看一个基本的例子

>>> import pandas as pd
>>> import matplotlib.pyplot as plt
>>> import seaborn as sns
>>> df = pd.read_csv('tips.csv')
>>> sns.relplot(data=df, x='total_bill', y='tip', kind='scatter')
<seaborn.axisgrid.FacetGrid object at 0x08890448>
>>> plt.show()

使用relplot函数来可视化x和y变量的关系,kind参数的值为scatter, 表示调用的是scatterplot这个子函数,这也是默认值,输出结果如下

直接调用scatterplot函数,用法如下

>>> sns.scatterplot(data=df, x='total_bill', y='tip')
<matplotlib.axes._subplots.AxesSubplot object at 0x0ED4A970>

输出结果如下

从可视化的效果而言,除了边框样式等展示形式外,坐标系内的元素是完全一致的。需要注意的是,不同level的函数返回的对象是不一样的,relplot函数返回的是FacetGrid对象,而子函数scatterplot函数返回的是axes对象,两者的用法有所区别。

seaborn采用了类似R语言ggplot2的属性映射和分面思想,可以很方便的将数据框的不同列映射为不同的属性,用法如下

1. 属性映射

hue参数用于映射颜色属性,style颜色用于映射形状属性,size参数用于映射点的大小属性,这些参数在大类和子类函数中同时适用,用法如下

>>> sns.relplot(data=df, x='total_bill', y='tip', hue='day', style='day')
<seaborn.axisgrid.FacetGrid object at 0x00DA33E8>

输出结果如下

2. 分面

通过row和col参数将数据框的列映射为不同的分面,该方法仅在大类函数中适用,用法如下

>>> sns.relplot(data=df, x='total_bill', y='tip', hue='day', col='time')
<seaborn.axisgrid.FacetGrid object at 0x0ED4A790>

输出结果如下

这种属性映射和分面的语法,为数据可视化提供了极大的便利,相同的效果,如果完全用matplotlib的语法来实现,代码量会大大增加。

除此之外,该模块还提供了joint, pair等更加灵活的数据探究方式

1. pairplot

pairplot用于快速可视化数据框各列元素之间的关系,用法如下

>>> sns.pairplot(df)
<seaborn.axisgrid.PairGrid object at 0x00D42310>

输出结果如下

2. jointplot

jointplot是一个组合图,用于探究两个变量间的关系,用法如下

>>> sns.jointplot(data=df, x='total_bill', y='tip', hue='day')
<seaborn.axisgrid.JointGrid object at 0x00823DD8>

输出结果如下

除了以上功能外,seaborn还有许多其他的功能,后续在详细介绍。

·end·

—如果喜欢,快分享给你的朋友们吧—