hpv病毒基因研究调研
时间:2022-05-03
本文章向大家介绍hpv病毒基因研究调研,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
2015年有一篇文献中提到了hpv的研究现状
As of May 30, 2015, 201 different HPV types had been completely sequenced and officially recognized and divided into five PV-genera: Alpha-, Beta-, Gamma-, Mu-, and Nupapillomavirus.
文献地址: http://www.ncbi.nlm.nih.gov/pubmed/26086163
根据文献,我找到了hpv所有已知测序种类的参考基因组网站:http://www.hpvcenter.se/html/refclones.html
截至到2015年7月已经有了205种,我爬取它们的genebank ID号,然后用python程序批量下载了它们的序列,能下载的序列共179条,都是8K左右的碱基序列。
根据genebank ID或者其它ID号批量下载核酸序列的脚本如下:
import sysimport timeimport randomfrom Bio import Entrezids=[]infile=sys.argv[1]for line in open(infile,'r'):line=line.strip()ids.append(line)for i in range(1,len(ids)):# t = random.randrange(0,5)handle =Entrez.efetch(db="nucleotide", id=ids[i],rettype="fasta",email="jmzeng1314@163.com")# time.sleep(t)print handle.read()
脚本的使用很简单,保持输入文件是一行一个ID号即可。同时,根据文献我们也能得到hbv病毒提取方法当然,我当年居然写过python???
同样,拿到下载的178条序列我们可以做一个进化树,在那篇文章中已经做好了,我就不做了。
下载179条hpv序列,每条序列都是8KB左右。我还用了R脚本批量下载
library(ape)a=read.table("hpv_all.ID") #输入文件是一行一个ID号即可for (i in 1:nrow(a)){tmp=read.GenBank(a[i,1],seq.names = a[1,1],as.character = T)write.dna(tmp,"tmp.fa",format="fasta", append=T,colsep = "")}
然后用muscle做比对,比对过程相对比较简单,大家感兴趣可以参照我之前的几篇笔记。
- Muscle进行多序列比对 http://www.bio-info-trainee.com/?p=659
- Figtree的把进化树文件可视化 http://www.bio-info-trainee.com/?p=660
- 用phyML对多重比对phy文件来构建进化树 http://www.bio-info-trainee.com/?p=626
muscle -in mouse_J.pro -out mouse_J.pro.amuscle -maketree -in mouse_J.pro.a -out mouse_J.phy
貌似时间有点长呀,最后还莫名其妙的挂掉了,可能是我的这个测试服务器配置有点低。
(非常经典的 segmentation fault )
进化树如下所示:
- new and override
- 初识SignalR~仿QQ即时聊天(群发,单发)(Web,WPF等Demo演示)【上】
- 【翻译】A Next-Generation Smart Contract and Decentralized Application Platform
- asp.net回调javascript
- Oracle9i第2版中的UNT_FILE提高了文件输入/输出(I/O)功能。
- Python 工匠:善用变量来改善代码质量
- sql数据库打包部署安装
- 打包并自动安装sql数据库
- SQL 2008 r2 安装提示 visual studio 2008 版本错误解决方法
- mssql 获取表空间大小
- SQLite 带你入门
- Windows下Nginx+Mysql+Php(wnmp)环境搭建
- LNMP源码编译安装(centos7+nginx1.9+mysql5.6+php7)
- MySQL SHOW PROFILE(剖析报告)的查看
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- logback 通过javaconfig实现配置
- springboot通过javaconfig实现logback配置
- 干货来了,vue 3.0 自定义指令变化
- XXE注入漏洞
- vue + typescript 类组件教程
- 图像处理笔记(3)----OpenCV图像算术运算
- V - Distpicker 是一个简单易用的地区选择器
- [漫谈] 状态
- 变量覆盖
- 【Rust日报】2020-08-27 在Arduino Uno上面跑 Rust 程序
- 浅谈类加载
- Rust FFI 编程 - Rust导出共享库06
- go语言文件操作汇总
- Redis 主从复制 哨兵模式实战
- 【Rust日报】2020-08-28 Rust 1.46稳定版发布