单基因生信分析流程(6)单基因相似性分析
时间:2022-07-23
本文章向大家介绍单基因生信分析流程(6)单基因相似性分析,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
第一步,下载COAD数据
##########################################################################################
## step1 load package and change Working Directory
###########################################################################################
library(TCGAbiolinks)
library(dplyr)
library(tidyr)
library(tibble)
library(edgeR)
library(limma)
rm(list=ls())
setwd('D:\SCIwork\F20ELFN1\COAD')
##########################################################################################
## step2 download the expresssion data of lncRNA and mRNA
###########################################################################################
query <- GDCquery(project = "TCGA-COAD",
data.category = "Transcriptome Profiling",
data.type = "Gene Expression Quantification",
workflow.type = "HTSeq - Counts")
GDCdownload(query, method = "api", files.per.chunk = 50)
library(SummarizedExperiment)
expdat <- GDCprepare(query = query, save = TRUE, save.filename = "exp.rda")
count_matrix = as.data.frame(assay(expdat))
第二步,注释表达量
##########################################################################################
###########################################################################################
rm(list=ls())
setwd('D:\SCIwork\F20ELFN1\COAD')
load('exp.rda')
count_matrix = as.data.frame(assay(data))
count_matrix[1:4,1:4]
fpkmToTpm <- function(fpkm)
{
exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
}
expr <- as.data.frame (apply(count_matrix , 2, fpkmToTpm))
expr <- expr %>% rownames_to_column("gene_id")
##########################################################################################
###########################################################################################
setwd("D:\Originaldata\GRCH\Homo_sapiens.GRCh38.90")
load("gtf_df.Rda")
test <- gtf_df[1:5,]
View(test)
mRNA_exprSet <- gtf_df %>%
dplyr::filter(type=="gene",gene_biotype=="protein_coding") %>%
dplyr::select(c(gene_name,gene_id,gene_biotype)) %>%
dplyr::inner_join(expr,by ="gene_id") %>%
tidyr::unite(gene_id,gene_name,gene_id,gene_biotype,sep = " | ")
save(mRNA_exprSet,file = "mRNA_exprSet.Rda")
mRNA_exprSet <- mRNA_exprSet %>%
tidyr::separate(gene_id, c("gene_name","gene_id","gene_biotype"),
sep = " \| ")
mRNA_exprSet <- mRNA_exprSet[,-(2:3)]
index <- duplicated(mRNA_exprSet$gene_name)
mRNA_exprSet <- mRNA_exprSet[!index,]
row.names(mRNA_exprSet) <- mRNA_exprSet$gene_name
mRNA_exprSet$gene_name <- NULL
setwd('D:\SCIwork\F20ELFN1\COAD')
save(mRNA_exprSet, file = "mRNA_exprSet.Rda")
第三步,提取肿瘤表达矩阵
##########################################################################################
###########################################################################################
rm(list=ls())
load( "mRNA_exprSet.Rda")
metadata <- data.frame(colnames(mRNA_exprSet ))
colnames(metadata) <- 'barcode'
for (i in 1:length(metadata[,1])) {
num <- as.numeric(as.character(substring(metadata[i,'barcode'],14,15)))
if (num == 1 ) {metadata[i,2] <- "T"}
if (num != 1) {metadata[i,2] <- "N"}
}
names(metadata)[2] <- 'Barcode'
table(metadata$Barcode)
metadata <- subset(metadata, metadata$Barcode == 'T')
mRNA_exprSet <- mRNA_exprSet[,which(colnames(mRNA_exprSet) %in% metadata$barcode)]
setwd('D:\SCIwork\F20ELFN1\COAD')
save(mRNA_exprSet, file = "mRNA_exprSet.Rda")
第四步,根据基因表达量筛选一些基因
- Nodejs学习笔记(三)——一张图看懂Nodejs建站
- 不规则图形的碰撞检测
- 自学WP7第一个例子:时钟
- 教您最简单粗暴的MATLAB入门级爬虫2
- 前台JS(Jquery)调用后台方法 无刷新级联菜单示例
- 项目中对图片的缩放和水印效果
- 照虎画猫写自己的Spring——自定义注解
- 数据分析进阶课程笔记(六)
- 微信发布重磅更新!上线小游戏,小程序间可快速切换
- 鼠标点击层以外的地方层隐藏
- WCF后续之旅(11): 关于并发、回调的线程关联性(Thread Affinity)
- WCF后续之旅(11): 关于并发、回调的线程关联性(Thread Affinity)
- 解决文本框在updatepanel中得到焦点,输入法不能切换到中文的问题
- 得到真实外网IP、IP所在国家、省份、地区
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Android 布局中的android:onClick的使用方法总结
- Android 提交或者上传数据时的dialog弹框动画效果
- Android 调用系统应用的方法总结
- Android实现网易严选标签栏滑动效果
- Android socket实现原理详解 服务端和客户端如何搭建
- Android使用ViewFlipper实现图片切换功能
- Android 图片显示与屏幕适配的问题
- Android实现截图和分享功能的代码
- Android 自定义相机及分析源码
- Android实现微博菜单弹出效果
- Android开发之拖动条和评分组件用法分析
- Android使用AsyncQueryHandler实现获取手机联系人功能
- Android用过TextView实现跑马灯效果的示例
- android如何设置Activity背景色为透明色
- Android 手机防止休眠的两种实现方法