seaborn分类变量的汇总展示

时间:2022-07-27
本文章向大家介绍seaborn分类变量的汇总展示,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

所谓分类变量的汇总展示,就是根据分类变量对样本进行分组,然后展示每一组的分布,适合多组数据的横向比较。在seaborn中,通过了柱状图,箱体图,小提琴图等多种可视化形式,来展示不同组数据的异同,具体的函数列表如下

1. stripplot,

2. swarmplot

3. boxplot

4. violinplot

5. boxenplot

6. pointplot

7. barplot

8. countplot

1. stripplot

该函数绘制的是扰动的散点图,基本用法如下

>>> df = pd.read_csv('tips.csv')
>>> sns.stripplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

2. swarmplot

该函数绘制的是蜜蜂图,基本用法如下

>>> sns.swarmplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

3. boxplot

该函数绘制的是箱体图,基本用法如下

>>> sns.boxplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

4. violinplot

该函数绘制的是小提琴图,基本用法如下

>>> sns.violinplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

5. boxenplot

该函数绘制的是增强版的箱体图,基本用法如下

>>> sns.boxenplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

6. pointplot

该函数统计分组变量的均值和标准差,用errorbar加折线图的形式展示,基本用法如下

>>> sns.pointplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

7. barplot

该函数统计分组变量的均值和标准差,用柱状图进行展示,基本用法如下

>>> sns.barplot(data=df, x="day", y="total_bill")
>>> plt.show()

输出结果如下

8.countplot

该函数统计每个组别下的样本个数,用柱状图展示,基本用法如下

>>> sns.countplot(data=df, x="day", hue="sex")
>>> plt.show()

输出结果如下

上述各种函数对应的figure-level级别的函数为catplot, 基本用法如下

>>> sns.catplot(data=df, x="day", y="total_bill", col='sex')
>>> plt.show()

输出结果如下

对于分类变量的比较和展示,seaborn提供了多种可视化方式,而且内置了统计功能,我们只需要体用数据,就可以直接得到美观的统计图表了,非常的便利。