RSeQC判断链特异性(strand-specific)
时间:2022-07-22
本文章向大家介绍RSeQC判断链特异性(strand-specific),主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
对于strand-specific的RNA-seq而言,我们必须得知道它是哪一种建库方式,才能进行后续的定量分析。
stringtie:
--rf Assumes a stranded library fr-firststrand.
--fr Assumes a stranded library fr-secondstrand.
kallisto:
--fr-stranded runs kallisto in strand specific mode, only fragments where the first read in the pair pseudoaligns to the forward strand of a transcript are processed. If a fragment pseudoaligns to multiple transcripts, only the transcripts that are consistent with the first read are kept.
--rf-stranded same as --fr-stranded but the first read maps to the reverse strand of a transcript.
现在比较常用的方式是fr-firststrand,也就是基于d-UTP的建库方式。但是为了更稳妥的判断,我们可以使用RSeQC中的工具来判断。RSeQC是2012年发表在Bioinformatics上的一个工具,包含多种功能:
1. 安装
# pip安装
pip3 install RSeQC
# 源代码安装
tar zxf RSeQC-VERSION.tar.gz
cd RSeQC-VERSION
#type 'python setup.py install --help' to see options
python setup.py install #Note this requires root privilege
or
python setup.py install --root=/home/user/XXX/ #install RSeQC to user specificed location, does NOT require root privilege
#This is only an example. Change path according to your system configuration
export PYTHONPATH=/home/user/lib/python2.7/site-packages:$PYTHONPATH
#This is only an example. Change path according to your system configuration
export PATH=/home/user/bin:$PATH
2. infer_experiment.py
单端数据:
infer_experiment.py -r hg19.refseq.bed12 -i SingleEnd_StrandSpecific_36mer_Human_hg19.bam
#Output:
This is SingleEnd Data
Fraction of reads failed to determine: 0.0170
Fraction of reads explained by "++,--": 0.9669
Fraction of reads explained by "+-,-+": 0.0161
"++,--" 的比例远远超过另一种,这是strand-specifc的数据。++,--就是指的测出来的正链即实际的正链,负链就是实际的负链。
如上图这种,就是非链特异性的单端数据。
如果两种接近1:1,则是非链特异性,而假如两种比例悬殊,则是链特异性。
双端数据:
infer_experiment.py -r hg19.refseq.bed12 -i Pairend_StrandSpecific_51mer_Human_hg19.bam
#Output::
This is PairEnd Data
Fraction of reads failed to determine: 0.0072
Fraction of reads explained by "1++,1--,2+-,2-+": 0.9441
Fraction of reads explained by "1+-,1-+,2++,2--": 0.0487
这种显然是链特异性,而且是fr-secondstrand。意思就是read1在+链,相对的gene也同样在+链上,而read2在+链,相对的gene在-链上。这种就是kallisto中的--fr-stranded和stringtie中的--fr。
现在这种特异性的library相对较少,而下面这种更为常见:
主要是“1+-,1-+,2++,2--”这种,也就是read1在+链,相对的gene其实是在-链(reverse)。这种就是“fr-firststrand”,也就是参数中的--rf。
同样两种在0.5附近的是non-specific:
infer_experiment.py -r hg19.refseq.bed12 -i Pairend_nonStrandSpecific_36mer_Human_hg19.bam
#Output::
This is PairEnd Data
Fraction of reads failed to determine: 0.0172
Fraction of reads explained by "1++,1--,2+-,2-+": 0.4903
Fraction of reads explained by "1+-,1-+,2++,2--": 0.4925
判断所需要的refseq文件可以在说明页面找到下载:
参考:
- 数据库负载急剧提高的应急处理(二) (r9笔记第55天)
- 社团划分——有向图的Label Propagation算法
- Python基础——网络编程
- 分区表的一个持续改进方案(r9笔记第53天)
- python jieba分词(结巴分词)、提取词,加载词,修改词频,定义词库
- MySQL中的NULL和空串比较 (r9笔记第52天)
- Core-periphery decomposition--核心-外围模型R代码整理
- 停止数据库没有响应的问题分析(r9笔记第51天)
- Hive——巧用transform处理复杂的字符串问题
- 停止数据库没有响应的问题分析(r9笔记第50天)
- 一个SQL语句引发的ORA-00600错误排查(一) (r9笔记第64天)
- 一个SQL语句引发的ORA-00600错误排查(二)(r9笔记第65天)
- 关于all_procedures的问题分析 (r9笔记第61天)
- 半自动化搭建Data Guard的想法和实践(一) (r9笔记第74天)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 前端|初学vue
- 使用clusterProfiler对非模式生物进行富集分析
- 微信小程序|逻辑判断
- R语言绘图 | 给气泡矩阵图上个色
- 前端|创建简单动态时钟
- R语言做几何布朗运动的模拟:复杂金融产品的几何布朗运动的模拟
- 手把手教你使用Flask搭建ES搜索引擎(实战篇)
- 【基础篇】Python+Go——带大家一起另寻途径提高计算性能
- 转录组分析 | 使用Trimmomatic过滤Fastq文件
- 转录组分析 | 使用FastQC进行数据质控
- R语言绘图 | 给箱线图加个点
- R语言绘图 | 使用pheatmap快速绘制热图
- 可能是目前最详细从零开始配置 TypeScript 项目的教程
- 比对得到的SAM文件怎么看?
- ANTNet|端侧架构,精度速度双超MobileNetV2