dplyr包summarize的使用

时间:2022-07-24
本文章向大家介绍dplyr包summarize的使用,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

创建数据框

dat<-mtcars
dat

对数据分组

dat1<-group_by(dat,cyl,gear)
summarize(dat1)
# A tibble: 8 x 2
# Groups:   cyl [3]
    cyl  gear
  <dbl> <dbl>
1     4     3
2     4     4
3     4     5
4     6     3
5     6     4
6     6     5
7     8     3
8     8     5

cyl有4,6,8三种取值,而gear有3,4,5三种取值,应该一共有9组,但我们这里只有8组,原因是cyl=8,gear=4的没有,默认不填补缺失值就会被 drop 掉

计算一些统计量

summarise(dat1, Q1 = quantile(disp, 0.25), ME = median(disp), Q3 = quantile(disp, 0.75))
    cyl  gear    Q1    ME    Q3
  <dbl> <dbl> <dbl> <dbl> <dbl>
1     4     3 120.  120.   120.
2     4     4  78.0  93.5  126.
3     4     5 101.  108.   114 
4     6     3 233.  242.   250.
5     6     4 160   164.   168.
6     6     5 145   145    145 
7     8     3 297.  355    410 
8     8     5 314.  326    338.