文献笔记二十九:银合欢(Leucaena trichandra)线粒体基因组
文章题目
PacBio-Based Mitochondrial Genome Assembly of Leucaena trichandra (Leguminosae) and an Intrageneric Assessment of Mitochondrial RNA Editing
发表期刊、单位、年份
GBE Genome Biology and Evolution Accepted: August 17, 2018 New Mexico State University Department of Systematic and Evolutionary Botany, University of Zurich, Switzerland(苏黎世大学) 论文本地存储名:evy179.pdf
现阶段还是重点关注完整线粒体的组装方法,原文数据公开,还公布了组装使用的shell脚本,争取重复组装过程
DNA Extraction, and Sequencing
sapling 树苗 polysaccharide 多糖 Aquagenomic DNA extraction protocol For each extraction 10 mg of fresh young leaf material was obtained from a L. trichandra sapling that had been kept in the dark for 24h to reduce polysaccharide concentration. DNA with an average fragment size of 21 kbp was submitted for sequencing. PacBIo P6-C4 chemistry
Genome Assembly
followed an iterative approach begins with the assembly of highly conserved regions and extends from that starting point. The pipeline involved:
- using BLASR to map raw reads against the reference
- filtering hits by a minumum aligned length (500 bp)
- recovering the qualifying reads to a new fastq file using seqtk
- assembling reads with Canu.
The L.trichandra PacBio reads provided sufficient long read data to also assemble the mitochondrial genome. Nonetheless, when we identified likely mt-genome contigs recovered from assemblies derived from all the available reads (which includes mitochndrial, nuclear, and plastid data in large computationally intensive analyses), the mitochondrial portion was moderately fragmented (> 7 contigs).
计算机资源:The project primarily employed an AMD7252 32 core server with 256 GB of RAM.
将路径改和数据替换为自己的以后运行脚本,遇到报错
[Pomgroup@localhost Pome_Mito_practice]$ bash Iternative_assembly_Pome_Mito.sh
Iternative_assembly_Pome_Mito.sh: line 2: $'r': command not found
Iternative_assembly_Pome_Mito.sh: line 4: syntax error near unexpected token `$'r''
'ternative_assembly_Pome_Mito.sh: line 4: `
解决办法
https://hacpai.com/article/1488765818607
sed -i 's/r$//' Iternative_assembly_Pome_Mito.sh
原因解释
https://blog.csdn.net/Lnho2015/article/details/51322289
Linux的基础知识还有好多得仔细看!
脚本对应的链接
https://github.com/cdb3ny/Mitochondrial-Genome-Scripts/blob/master/Iternative_assembly_script.sh
脚本中用到的命令逐行解释
- 首先是blasr比对 用法是
blasr nanopore.fastq reference.fasta --nproc 16 > blasr.out
blasr.out 好像对应的是 https://github.com/PacificBiosciences/blasr/wiki/Blasr-Output-Format
这个链接上的 -m为1
- 操作输出结果blasr.out
awk '{a=$8-$7;print $0,a;}' blastr.out
第8列减去第7列赋值给a并且将a添加到文件的最后一列
awk '{a=$8-$7;print $0,a;}' blastr.out | sort -n -r -k14,14
按照第14列倒叙排列
awk '{a=$8-$7;print $0,a;}' blastr.out | sort -n -r -k14,14 | awk '$14>500'
第14列大于500的行
awk '{a=$8-$7;print $0,a;}' blastr.out | sort -n -r -k14,14 | awk '$14>500' | cut -d ' ' -f1,1
以空格作为分隔符分割然后提取第一列 这样就得到了比对长度大于500的fastq的reads的id
grep -F -x -v -f
这行命令是干什么的还不知道
根据id提取序列(fastq)
seqtk subseq nanopore.fasta ids.txt > aligned.fastq
canu组装
canu -p hehuan -d hehuan-oxford genomeSize=2000k -nanopore-raw aligned.fastq
最后再用canu软件组装的结果作为参考序列重复这个过程,原论文的脚本for i in 1:10
相当于是重复了10次这个过程。
好了,这篇文章暂时看到这里了
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- k8s中服务添加hosts及一键转换脚本
- 【一起学系列】之状态模式:你听过“流程”模式吗?
- 【一起学系列】之代理模式:是为了控制访问啊!
- 【一起学系列】之剩下的设计模式们
- 如何使用k3OS和Argo进行自动化边缘部署?
- 设计模式总篇:从为什么需要原则到实际落地(附知识图谱)
- 一文入门DNS?从访问GitHub开始
- 没内鬼,来点干货!SQL优化和诊断
- 好像很厉害的生成器!一秒钟搞定一个项目
- 【一起学系列】之策略模式:好多鸭子啊
- 没内鬼,来点干货!volatile和synchronized
- 【一起学系列】之观察者模式:我没有在监控你啊
- Celery 4 初体验及踩坑
- MySQL 最佳实践:gh-ost 工具使用详解
- 如何将 Hexo 博客部署到云开发静态网站托管