R语言因子排序

时间:2019-12-14
本文章向大家介绍R语言因子排序,主要包括R语言因子排序使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

画图的时候,排序是个很重要的技巧,比如有时候会看下基因组每条染色体上的SNP的标记数量,这个时候直接做条形图是一种比较直观的方法,下面我们结合实际例子来看下:

在R环境下之际构建一个数据框,一列染色体名称,一列统计数据。

  1 chr<-paste("chr",c(1:18,"X","Y"),sep="")
  2 set.seed(2)
  3 num<-runif(20,100,5000)
  4 df<-data.frame(chr=chr,num=num)
  5 df

内容如下:

一、barplot()

我们直接用基础绘图函数barplot()画图,染色体顺序是不会变化的:

  1 barplot(t(as.matrix(df$num)),col="cyan",border = NA,names.arg = df$chr)

二、ggplot2

如果用ggplot2画图,染色体顺序就不是我们想要的了:

  1 library(ggplot2)
  2 ggplot(df,aes(y=num,x=chr,fill=chr))+geom_bar(stat = 'identity')

我们可以利用factor进行因子排序,将顺序调整成我们需要的样子:

  1 ggplot(df,aes(y=num,x=factor(chr,levels=(chr)),fill=chr))+
  2   geom_bar(stat = 'identity')

或者其他形式,这里我把X,Y染色体提前:

  1 ggplot(df,aes(y=num,fill=chr,
  2               x=factor(chr,levels=(paste("chr",c("X","Y",1:18),sep="")))))+
  3   geom_bar(stat = 'identity')

后续继续做其他调整,如图例顺序调整。

原文地址:https://www.cnblogs.com/mmtinfo/p/12039757.html