R语言入门之数据排序、合并、分类汇总

时间:2022-07-22
本文章向大家介绍R语言入门之数据排序、合并、分类汇总,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

1. 数据排序

在R中对数据框中的数据排序,我们通常使用order()函数,该函数默认是升序,但是在要排序的变量前加上减号(-)就相当于降序排列了。

# 以mtcars数据为例对数据进行排序
attach(mtcars) # 固定数据集
# 按变量mpg排序
newdata <- mtcars[order(mpg),] 
# 按变量mpg和cyl排序
newdata <- mtcars[order(mpg, cyl),]
#按变量mpg(升序)和cyl(降序)排序
newdata <- mtcars[order(mpg, -cyl),] 
detach(mtcars) # 解固定数据集

2. 数据合并

2.1 添加列

将数据水平合并时我们通常使用merge()函数,合并时你可以指定一个或者多个关键字段(变量)。当然我们也可以使用cbind()函数,cbind()的使用前提是两数据框的行数相同,并且位置已经匹配完成。

# 按照ID对数据进行合并

total <- merge(dataframeA,dataframeB,by="ID")

# 按照ID和Country对数据框进行合并

total <-merge(dataframeA,dataframeB,by=c("ID","Country"))

2.2 添加行

将数据垂直合并时,我们常常使用rbind()函数,使用该函数时要求两数据框的列数相同,并且变量的顺序已经匹配好了。

# 对数据按行合并

total <- rbind(data frameA, data frameB)

3. 数据分类汇总

在R中对数据进行分类汇总是一件比较容易的事情:

# 对mtcars数据集的变量cyl和vs进行分类汇总并计算各组数值型变量的均值
attach(mtcars) # 固定数据集
aggdata <-aggregate(mtcars, by=list(cyl,vs), 
  FUN=mean, na.rm=TRUE) # 分类汇总
print(aggdata) # 输出结果
detach(mtcars) # 解固定数据集

这里aggregate()函数的FUN=参数是用来指定对各组变量进行的操作,是一个函数(R内置函数或自定义函数),na.rm=是用来指定是否移除缺失值的参数。

关于数据的排序、合并与分类汇总就先讲到这里,有兴趣的朋友可以自行深入探索。

至此,R语言入门的所有内容均已介绍完毕,在后面的内容我会相继带大家入门Python编程以及进阶R语言。