很多时候你就是不知道如何提问

时间:2022-07-24
本文章向大家介绍很多时候你就是不知道如何提问,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

最近分享的两个祖传的单细胞转录组数据分析代码,是标准流程:

其中有一个环节是需要比较seurat分群以及singleR的分群,这样就可以合理的命名啦。

但我给出的代码出图丑爆了,如果大家有体验过,估计也会是类似的吐槽,不过本来就是随便写的代码,重点是告诉大家分析流程,并不是个性化数据分析指南哈!

但是最近看CNS图表复现,就是:你要的rmarkdown文献图表复现全套代码来了(单细胞),发现一个超级好的函数,就是gplots包的balloonplot函数,可以非常方便的比较seurat分群以及singleR的分群,代码如下:

rm(list=ls()) 
library(Seurat) 
library(SingleR)
pro='only_immune'
load(file= paste0(pro,'_sce_output_of_seurat_singleR.Rdata'))
require(gplots)
tab.1 <- table(sce@meta.data$seurat_clusters,cellpred$labels)
tab.1
balloonplot(tab.1, main ="seurat VS singleR for all cells", xlab ="", ylab="",
            label = T, show.margins = F)

出图如下:

seurat分群以及singleR的分群的比较

根据上图,我们可以很确定第10群是macytoid dendritic cells,而第11群就是myeloid dendritic cells,其它就需要慢慢探索。

美化的事情就交给搜索啦,很久以前我就提到过,比如bing搜索就可以发现ggpubr的代码:

https://rpkgs.datanovia.com/ggpubr/reference/ggballoonplot.html

具体代码如下:

data=as.data.frame(tab.1)
ggballoonplot(data, fill = "Freq", color = "lightgray",
              size = "Freq", show.label = TRUE)+
  gradient_fill(c("blue", "white", "red"))

出图如下:

当然了,也有很多时候即使有好的可视化方法,也不能给你肯定的结论,比如下面的分群,就很尴尬,基本上命名和分群完全不一致。

而且gplots包的balloonplot函数并不是唯一的可视化方法,也可以是热图可视化:

    tab.1 <- tab.1[,names(which(colSums(tab.1) !=0))]
    # Zeros to NAs
    tab.1[tab.1 == 0] <- NA
    colfunc <- colorRampPalette(c("white", "red"))
    heatmap.2(tab.1, Rowv = F, Colv = F, col = colfunc(10), trace="n", key = T,
              colsep = 1:ncol(tab.1), sepcolor = "grey90", margins = c(5,10), rowsep = 1:nrow(tab.1), 
              cellnote=tab.1,
              notecex=1.0,
              notecol="black",
              na.color=par("bg"))

当然了, 细节调整都会很头疼。

不过,重点是,如果你没有看到教程之前,我们该如何去搜索呢,目的是可视化R语言里面的table函数的结果(针对2个分类变量).

这些代码大家都可以测试一下,