[数据库介绍]一站式表达谱数据分析

时间:2022-07-24
本文章向大家介绍[数据库介绍]一站式表达谱数据分析,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

表达谱数据分析的时候,经常包括各种各样的分析。比如差异表达分析,富集分析,GSEA,蛋白相互作用分析等等等等。NetwordAnalyst(https://www.networkanalyst.ca/)是一个一站式分析转录组数据的数据库。在这里我们可以分析常见的一些分析。

基本介绍

数据库一共包括 五种分析方式:

  1. 输入网络数据:比如从蛋白相互作用数据库下载下来的网络对应数据来进行可视化。其实功能类似于简易版的cytoscape。下图就是输入数据后得到的默认网络。
  2. gene list input:如果我们已经有目标基因了,需要进行富集分析;蛋白相互作用分析等。同时我们也可以输入多个数据集的结果,然后得到venn图相关的重叠结果进行分析。
  3. Gene Expression Table: 我们来输入RNA-seq或者microarray的表达矩阵,来进行下一步分析。
  4. Raw RNA-seq Data: 输入RNA-seq的 fastq格式的数据来进行下游分析。
  5. Multiple Gene Expression Tables: 输入多个数据集的表达矩阵,来对多个数据集进行整合的分析。

由于网站的功能很多,但是后续分析的结果类似,所以我们就用Multiple Gene Expression Tables来进行演示。

Multiple Gene Expression Tables

数据输入

点击Multiple Gene Expression Tables后,我们可以看到这样上传数据的界面。上传的表达矩阵的样本不能大于1000

我们通过点击Add New来上传表达矩阵。表达矩阵应该是是这样的一个格式。

第一行是样本的变化,同时用 #来增加一个NAME的表示代表第一列为基因名。

第二行是本次实验设计的分组。

后面的行数则为表达矩阵,第一列基因ID

PS:

我们使用实例文件来进行分析,实例文件包括三个数据集,两个RNA-seq以及一个芯片数据。

上传数据完成后,点击Proceed下一步。这里会提示我们是否想要下载一个融合的数据集,如果想要下载的话,可以点击Download。我们点击Next可以进行下一步

质量评估

分析的第一步就是对数据进行质量评估,评估每个样本的分布,这个网站提供了两种对于样本评估的方式。PCA图密度图

同时网站还提供了,对于不同数据集进行batch effect批次效应的矫正。

通过通过矫正完,可以看到矫正完的PCA图密度图

进行批次效应完事儿,我们点击Proceed

荟萃分析

通过完质量评估,并且去掉批次效应后,我们可以进行荟萃分析来结合不同数据库的结果来得到重叠的结果。数据库提供了不同的进行数据结果融合的方法,同时也给了推荐指数。

我们选择第一个点击submit,然后点击Proceed

差异基因

通过上面两部,我们可以得到差异表达基因。

同时我们点击View可以看到这个基因在每个数据集当中的变化。

接下来我们点击Proceed

下游分析

在下游分析中,网站给了现有的一些常用的分析。这些平时我们都是通过不同的软件来做的,但是这个网站整合到一起了。

PS:而且用一种正确的方式整合到一起了。(真的会有人会用差异分析的结果去做GSEA的)。

由于分析的结果较多,我们以Netword Visual Analytics来对来对其中的结果进行说明。剩下的大家可以自己去点点看。点击Netword Visual Analytics后,会让我们来选择用什么数据集。我们可以选择重叠的数据集也可以选择各自的数据集。我们选择融合的数据集。

点击完后,我们可以看到,很多目前文章里面做的网络都可以进行做。其中包括·蛋白相互作用分析(PPI); 转录调控网络; 疾病/药物相关网络共表达网络

而且网站对于一个分析也有很多其他的数据库可以选择。例如基因的蛋白相互作用(Generic PPI)。就可以选择string或者IMEx数据库。

我们选择好点击OK后,即可得到。对于网络的分析的一个初步的结果

下载

所有分析的结果,我们都可以下载下来

PS:其实目前很多基础的芯片数据分析的文章用这个网站就够了。而且方法也对,不会让一些不是很懂用法的虽然使用分析方式。当然同样的,这些也是最基本的分析方法,特别的还是需要自己分析的。