专属于六倍体小麦的Bioconductor注释包

小编之前写过一篇推送使用clusterProfiler对非模式生物进行富集分析，教大家使用clusterProfiler中的enricher函数进行富集分析。

专属于六倍体小麦的注释包。

此注释包是基于iwgsc_refseqv1.1版本的基因号制作的，GO注释来源于

https://doi.org/10.5281/zenodo.2541477。

制作好的注释包已上传至github，可以使用下面的代码安装。

## 安装注释包
install.packages("https://media.githubusercontent.com/media/biozhp/org.Ta.eg.db/master/org.Ta.eg.db.tar.gz", repos=NULL, type="source")

由于我还是个新手，所以还不太了解怎么压缩R包的大小，导致目前版本的R包有些大，下载需要一些时间，后续我会继续改进的~

一系列的操作后，R包就安装好啦~

接下来试着用注释包做富集分析。

## 加载R包
library("clusterProfiler")
library("org.Ta.eg.db")
## 输入基因
gene <- read.table("gene.txt",header=F,sep="t")
gene <- as.factor(gene$V1)
## 进行富集分析
org <- org.Ta.eg.db
enrich.go.BP <- enrichGO(gene=gene, OrgDb=org, keyType="GID",ont="BP", pvalueCutoff = 0.01, qvalueCutoff = 0.05)
## 对 GO term进行去冗余
simply <- simplify(enrich.go.BP)
## 输出结果
ouf <- paste("output.txt",sep ="t")
write.table(simply,ouf)

测试后发现可以正常使用，没有问题~

目前这个R包还只是一个测试版本，大家完成自己的分析后还是要仔细检查一下自己的结果有没有问题。

如果在使用过程中出现任何问题或者有任何建议，都可以写在https://github.com/biozhp/org.Ta.eg.db/issues 上，或者给我发邮件。

做小麦的同学赶快下载下来试一下吧~

参考资料：

Bioconductor的注释包太旧怎么办？自己做呀

https://www.jianshu.com/p/77246ff36214