从黑暗走向光明:Python包安装进阶之路

时间:2022-05-03
本文章向大家介绍从黑暗走向光明:Python包安装进阶之路,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

想当初刚学习Python的时候,就会用书本里面自带的一些package,用sysos也用得很开心。后来接触到biopython项目,发现原来Python有这么不同功能的包,简直琳琅满目。不过这也是我痛苦的开始,在服务器上装个包怎么那么费劲呢,缺这少那的。

为了一个包的安装,我得花多少时间啊,还能不能让人好好做科研了。

  • 黑暗时代

最开始的时候是从源码开始安装,一般 python setup.py install就执行安装过程了,不过可怕的这些包之间的依赖关系。而且安装的时候,要选择安装目录。对于刚开始学习的我,都要搞晕了。后来还看到一个叫 easy_install,可以自动解析package之间的依赖关系,生产效率感觉提上去了。不过经常出错,虽然比手动安装好多了,使用起来还是挺费劲的。

  • 迎来曙光

不知道当时从哪里看到说用 pip会更好,看来没事上上网还是挺有好处的。而且比 easy_install什么的不知道高到哪里去了,具体差异可以看:

pip vs easyinstall

https://packaging.python.org/pipeasy_install/

why use pip over easy_install

https://stackoverflow.com/questions/3220404/why-use-pip-over-easy-install

上面的链接都说得很详细了。对于一般的需求, pip install --user <package>就已经很受用了。如果再使用上豆瓣上的PyPi源,那使用体验简直不能太好。

# Linux/Mac用户修改# $HOME/.config/pip/pip.conf[global]timeout = 60index-url = https://pypi.doubanio.com/simple## 注意: 如果使用http链接,需要指定trusted-host参数[global]timeout = 60index-url = http://pypi.douban.com/simpletrusted-host = pypi.douban.com

常用的pip用法一般有:

# 在用户目录安装软件,不需要root 权限pip install --user <package># 搜索packagepip search biopython# 安装特定版本的package,版本号可以从search的结果中找到pip install biopython=1.69# 卸载packagepip uninstall biopython# 导出已安装的包信息pip freeze > requirements.txt# 其他使用方法可以参考pip的帮助说明pip -h
  • 发现virtualenv

如果你只是测试,或者电脑上同一个package安装了好几个版本,那么你一定会喜欢 virtualenv。有了它,现在可以在电脑上安装不同版本的package了。使用方法也很简单,因为 virtualenv也是Python包,可以直接用 pip来进行安装。现在可以用它在电脑上创建不同的虚拟环境了,各个虚拟环境互不干扰,而且对原有的环境不会造成影响,哪天不想玩了,直接把对应的目录删掉就可以了,非常方便 。

# 安装virtualenvpip install --user virtualenv# 创建一个新的环境mkdir my_envs cd my_envs# 创建一个env_test目录,把相关的package安装到该目录下virtualenv env_test# 如果系统上有多个python版本,可以通过参数来指定对应的python版本virtualenv -p /usr/bin/python2.7 env2.7# 激活虚拟环境,需要提供具体的虚拟环境安装目录source env2.7/bin/activate# 激活后就可以在终端中看到有对应提示,如果想关闭也很简单deactivate

上面的都一些基本的用法,如果创建的虚拟环境比较多,可以借助 virtualenvwrapper来进行管理,更多的信息可以参考Python虚拟环境:http://pythonguidecn.readthedocs.io/zh/latest/dev/virtualenvs.html。

  • 大杀器anaconda

当时在学习virtualenv的时候,也发现anaconda这个东西,不过当时觉得软件太多,而且比较臃肿,对我这种没装几个软件的来说,virtualenv已经够用了。直到有一天我需要安装tensorflow的时候,才发现这东西有多方便。不仅帮你解决依赖关系,而且还会帮你把相关的系统依赖也解决了。相信大家在安装软件的时候,没少遇到missing 什么 libxxxx.so什么的信息。有的时候为了安装这些系统依赖,真的能把人搞疯。anaconda不仅能解决这些问题,还可以安装R里面package啊, 虽然我没用过这个功能。现在除了anaconda,还有精简的miniconda和专门为生物信息准备的bioconda,虽然名字不一样,只是默认安装时带的package不一样而已,使用方法没什么区别。下面简单说明下bioconda的使用:

# 首先需要安装conda,我们下载minicoda,文件比较小,下载过程比较快wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.shbash Miniconda3-latest-Linux-x86_64.sh

这样在你的 $HOME目录里面有一个miniconda,保存安装的软件使用,而且自动在环境变量配置文件 .bashrc添加新的变量设置。安装之后可以自己检查一下,是不是有新的不一样的东西。你需要要重新登录一下或者重新加载环境变量 source ~/.bashrc。因为网络环境问题,最好修改一下安装软件源,可以使用清华anaconda开源镜像源 https://mirror.tuna.tsinghua.edu.cn/help/anaconda/

# 请注意一上顺序哈conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/conda config --add channels defaultsconda config --add channels rconda config --add channels bioconda

目前清华源没有bioconda的镜像,大家可以到https://github.com/tuna/issues/issues/112这里提一下需求。简单的使用过程可以参考bioconda的文档 https://bioconda.github.io/上的说明,下面说一下对经常用的几个命令

# 搜索特定软件包conda search package-name  # 新建一个叫py3的环境,这个环境里面我们需要指定使用python3 conda create -n py3 python=3.5.3# 激活虚拟环境 source activate py3   # 关闭虚拟环境source deactivate  # 列出已经创建的虚拟环境  conda info --evns
  • 参考
  1. pip使用豆瓣源 http://www.cnblogs.com/ZhangRuoXu/p/6370107.html
  2. Python虚拟环境 http://pythonguidecn.readthedocs.io/zh/latest/dev/virtualenvs.html

编辑:思考问题的熊