专属于六倍体小麦的Bioconductor注释包

时间:2022-07-23
本文章向大家介绍专属于六倍体小麦的Bioconductor注释包,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

小编之前写过一篇推送 使用clusterProfiler对非模式生物进行富集分析,教大家使用clusterProfiler中的enricher函数进行富集分析。

专属于六倍体小麦的注释包

此注释包是基于iwgsc_refseqv1.1版本的基因号制作的,GO注释来源于

https://doi.org/10.5281/zenodo.2541477。

制作好的注释包已上传至github,可以使用下面的代码安装。

## 安装注释包
install.packages("https://media.githubusercontent.com/media/biozhp/org.Ta.eg.db/master/org.Ta.eg.db.tar.gz", repos=NULL, type="source")

由于我还是个新手,所以还不太了解怎么压缩R包的大小,导致目前版本的R包有些大,下载需要一些时间,后续我会继续改进的~

一系列的操作后,R包就安装好啦~

接下来试着用注释包做富集分析。

## 加载R包
library("clusterProfiler")
library("org.Ta.eg.db")
## 输入基因
gene <- read.table("gene.txt",header=F,sep="t")
gene <- as.factor(gene$V1)
## 进行富集分析
org <- org.Ta.eg.db
enrich.go.BP <- enrichGO(gene=gene, OrgDb=org, keyType="GID",ont="BP", pvalueCutoff = 0.01, qvalueCutoff = 0.05)
## 对 GO term进行去冗余
simply <- simplify(enrich.go.BP)
## 输出结果
ouf <- paste("output.txt",sep ="t")
write.table(simply,ouf)

测试后发现可以正常使用,没有问题~

目前这个R包还只是一个测试版本,大家完成自己的分析后还是要仔细检查一下自己的结果有没有问题

如果在使用过程中出现任何问题或者有任何建议,都可以写在https://github.com/biozhp/org.Ta.eg.db/issues 上,或者给我发邮件。

做小麦的同学赶快下载下来试一下吧~

参考资料:

Bioconductor的注释包太旧怎么办?自己做呀

https://www.jianshu.com/p/77246ff36214