【直播】我的基因组76:用krona对血液全基因组的菌比例可视化

时间:2022-05-03
本文章向大家介绍【直播】我的基因组76:用krona对血液全基因组的菌比例可视化,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

关于我前面我说到的NGS测序血液里面的菌的问题,总共8.9亿reads里面是有部分(850万)无法比对上的,850万里面只有不到10万比对到了微生物,说明我的基因组里面的微生物序列实在是太少了。很多人都给我了一些解释:

其实我用的软件和数据库就是基于kmer的,所以Tong Liu的解释我很认同。

liang博士

血液中有大量的细菌即菌血症,是很严重的感染。但是血液中有少量的细菌很正常,本来免疫系统的吞噬清除和微量感染就是一个平衡,准无菌水平而已。reads只占这么少的部分正常。

我们生信技能树论坛早就有帖子介绍:http://www.biotrainee.com/thread-1403-1-1.html 人类血液里面必然是有细菌等微生物(点击原文进行查看)

苏博士

上面的朋友说得差不多了。

湿的方面:多数是污染,气溶胶之类的污染还是不能完全避免。还有就是毕竟不是每个人都是“标准基因组”。

干的方面:也有极少量是随机匹配上的。还有就是比对软件也有各自的局限的,其实哪有绝对的标准答案。

另外,上面的一位朋友可以拿同样的数据再比对看看结果,比对数量增多可能只是细菌的数据库越来越丰富了而已。

虽然我也相信正常人血液中会存在痕量细菌这一情况,但其实就算这些测到的真是细菌的reads,那离血液中存在细菌这个结论还差得远呢。所以这个标题有点标题党了。甚至,也有可能这个结果比真实情况还偏低呢,针对动物血液的试剂盒,对细菌DNA的提取效率未必高。

随着高通量方法的发展,科赫原则也有了不少新的修正和发展,但其实也没个公论。

其他吃瓜群众说到:

吃瓜群众

抽血也可以引入皮肤定植菌,可以查一查这些细菌通常的传播途径和看看是不是很多可以经呼吸道传播。还有就是是不是正常菌群里的,比对一下病毒库,说不定也有很多病毒序列呢

下面进入正题:

前面我们介绍了表格版本的总结结果,比对成功的reads具体按照界门纲目科属种给数一下多少,然后算一下百分比。

其实比较主流的是用krona这个可视化js插件来把这个层级表格展现出来,如下:

圈圈从内到外依次是,界门纲目科属种,一般来说看最外层的各个菌种的占比即可。

要做这个图,首先需要安装krona软件,然后根据GOTTCHA软件对reads的分类文件进行处理即可。

Krona 百度搜索结果一般是冰岛克朗,是冰岛的官方货币,不过在生物信息学领域是一个可视化工具,而且用的是html5哦。你谷歌就明白了!

主页:https://github.com/marbl/Krona/wiki

安装方法是:

cd ~/biosoft
# https://github.com/marbl/Krona/wiki
mkdir Krona && cd Krona
wget https://github.com/marbl/Krona/releases/download/v2.7/KronaTools-2.7.tar
## https://github.com/marbl/Krona/wiki/KronaTools
tar xvf KronaTools-2.7.tar
cd KronaTools-2.7
mkdir bin
./install.pl --prefix ./

可视化命令:

~/biosoft/Krona/KronaTools-2.7/bin/ktImportText  P_jmzeng_temp/P_jmzeng.lineage.tsv -o P_jmzeng.krona.html

打开生成的html文件,就能看到上面的图啦。