Python服务Debian打包新思路
此文已由作者张耕源授权网易云社区发布。
欢迎访问网易云社区,了解更多网易技术产品运营经验。
Debian 打包一直是比较冷僻的技术,大部分同学都不会接触到它。
但是我们 Debian 服务器上安装的各种软件服务,都是通过各种打包工具制作出来的安装包部署到服务器上的。
Debian 打包虽然比较烦琐复杂,但是它提供了比较健全的一整套软件部署、安装、升级、维护的流程,
并有一系列与之配套的自动化工具,可以避免人工操作可能出现各种遗漏、错误,特别是在大规模部署时基本不可能人工操作。
我们云计算使用的 Openstack 基础服务,也是通过自己从头制作安装包、上传到 Debian 仓库、并最终通过 puppet 等自动化工具实现服务的部署、更新。
之前我们一直采用 Debian 官方的流程对 Openstack 的 Python 服务打包,但是在几年的实践中发现了各种无法解决的问题,
不得不自己另外实施一套全新的打包方案。
本文主要介绍 Debian 新打包方案的起因、原理、流程。
起因
我们以前使用了很长时间的 Debian 社区官方的 Openstack 服务打包方案,中间还尝试过一段时间的 virtualenv 打包方案,各自都有较大的问题,详见下面。
社区打包方案
原来我们从 Debian 社区 Openstack 项目打包仓库 fork 出来的自己做一些修改和 backport 然后打包的方案,
所有服务及其依赖的 Python 模块都通过 Debian 的 deb 格式安装包安装,这样存在一个主要问题:Debian 官方仓库中的 Python 模块版本更新太慢了。
比如常用的 Python 数据库第三方模块 SQLAlchemy ,在 Python 的官方 PyPI 中已经更新到了 1.1.4 版本,但在 Debian Wheezy 的仓库中仅有 0.7.8 版本,差了4个大版本。
我们在使用 Openstack 服务中发现的一些数据库相关问题,本来是简单的升级 SQLAlchemy 版本就能搞定的,由于这个问题变得很难解决。
这个问题直接导致我们很难升级一些有问题的 Python 模块依赖版本;有些需要的模块甚至根本没有 Debian 安装包,引进新模块、功能比较困难;升级 Openstack 服务的大版本基本不可能,后续也基本不可能从 Debian Wheezy 升级到 Jessie 了,影响非常大。
virtualenv 打包方案
在发现社区官方的打包方案的严重问题后,我们后面也尝试了一段时间通过 Python virtualenv 虚拟环境打包的方式,
即在一个 virtualenv 虚拟环境中通过 Python pip 工具安装相关 Python 依赖并将整个安装了服务与依赖的 virtualenv 环境打包成 Debian 安装包。
这个方案在后续使用中也发现很多问题,最大的问题还是本质上 virtualenv 并不能真正隔离系统的 Python 环境和自身虚拟环境的 Python 环境,最终导致服务各种诡异错误。
我们这里可以看一个例子
$ virtualenv test$ source test/bin/activate>>> import sys>>> sys.path
['','/home/stanzgy/workspace/test/lib/python2.7','/home/stanzgy/workspace/test/lib/python2.7/plat-linux2','/home/stanzgy/workspace/test/lib/python2.7/lib-tk','/home/stanzgy/workspace/test/lib/python2.7/lib-old','/home/stanzgy/workspace/test/lib/python2.7/lib-dynload','/usr/lib/python2.7','/usr/lib/python2.7/plat-linux2','/usr/lib/python2.7/lib-tk','/home/stanzgy/workspace/test/local/lib/python2.7/site-packages','/home/stanzgy/workspace/test/lib/python2.7/site-packages']>>> import json>>> json.__file__'/usr/lib/python2.7/json/__init__.pyc'>>> import _json>>> _json.__file__'/home/stanzgy/workspace/test/lib/python2.7/lib-dynload/_json.so'
在这个例子中,我们创建了一个虚拟环境 test ,并尝试在虚拟环境 import
Python 自带的 json 模块,结果发现引用的模块地址事实上是操作系统而不是虚拟环境的。
从 sys.path 的结果可以看到,虚拟环境中的 Python import 模块时会尝试先从虚拟环境中的 Python PATH 搜索,然后会尝试从系统的 Python PATH 搜索。如果 import 的模块二次引用其他的 Python 模块实现,则可能导致系统的 Python 模块和虚拟环境中的 Python 模块交叉使用的情况。
在上面的例子中,可以看到 json 模块和实现其部分功能的 _json 模块分别属于系统和虚拟环境。如果系统和虚拟环境中的 Python 版本、模块版本不一致,则很容易导致服务出现问题,并且最重导致 Python 进程本身崩溃,并且很难调试、查找原因。
virtualenv 打包方案从原理上并不可靠。
新 Debian 打包方案
需求
我们 Openstack 服务 Debian 打包在现有基础上的需求主要有三点:
能自由指定、更新 Python 依赖模块版本
不同 Openstack 服务之间的 Python 环境互相隔离
Openstack 服务的 Python 环境和系统的 Python 环境隔离
社区的方案三点都不满足,virtualenv 方案只满足第一、二点。
原理
新打包的流程比较复杂,但原理用一句话就能描述清楚:
每次打包独立编译 Python ,编译时通过设置 RPATH 变量实现隔离效果。
RPATH 是 Python 编译时设置的变量,效果是硬编码指定并限制程序运行时动态链接库的的搜索路径,类似 LD_LIBRARY_PATH。关于它的详细信息和讨论可以参考 Wikipedia 和 Debian Wiki
我们每个服务都使用不同的RPATH变量编译 Python 后,相当于每个服务都安装在一个独立的 Python 隔离环境里,使用各自独立的运行时动态链接库搜索路径。这样每个服务既可以随意更新修改自己的 Python 依赖模块版本、也避免了之前 virtualenv 方案存在的严重的系统环境隔离问题,解决了上面的三点需求。
下面是一个采用了新打包方案的 Openstack 服务的 Python 环境。
>>> import sys>>> sys.path
['','/srv/stack/nova/lib/python27.zip','/srv/stack/nova/lib/python2.7','/srv/stack/nova/lib/python2.7/plat-linux2','/srv/stack/nova/lib/python2.7/lib-tk','/srv/stack/nova/lib/python2.7/lib-old','/srv/stack/nova/lib/python2.7/lib-dynload','/srv/stack/nova/lib/python2.7/site-packages']>>> import json>>> json.__file__'/srv/stack/nova/lib/python2.7/json/__init__.py'>>> import _json>>> _json.__file__'/srv/stack/nova/lib/python2.7/lib-dynload/_json.so'
可以看到它有独立的 Python sys.path 路径、并且不存在和系统的 Python 交叉调用的问题。
流程
新 Debian 打包方案的流程,可简单描述为:
指定 RPATH,编译、安装 Python
使用新编译的 Python pip 安装依赖
安装 Python 服务到新编译好的 Python 独立环境
将上面创建的整个 Python 独立环境打包
处理其他配置文件、启动脚本等
下面为每个步骤的详细说明
编译 Python
所有项目编译 Python 使用同一个 build-python.sh 脚本
#!/bin/bash...export PROJECT_PREFIX=${PROJECT_PREFIX:-/srv/stack}export PROJECT_BASE=$PROJECT_PREFIX/$PROJECTexport PYTHON_FILE=${PYTHON_FILE:-Python-2.7.12.tar.xz}# Get python tarballCUR_DIR=$PWDTEMP_DIR=$(mktemp -d /tmp/pybuild.XXXX)cd $TEMP_DIRwget $PYTHON_URL/$PYTHON_FILEmkdir -p py27 && tar Jxf $PYTHON_FILE -C py27 --strip-components=1cd py27# Compile pythonDPKG_CPPFLAGS=$(dpkg-buildflags --get CFLAGS)
DPKG_CFLAGS=$(dpkg-buildflags --get CPPFLAGS)
DPKG_LDFLAGS=$(dpkg-buildflags --get LDFLAGS)
CFLAGS="$DPKG_CFLAGS $DPKG_CPPFLAGS" \
LDFLAGS="$DPKG_LDFLAGS,-rpath=$PROJECT_BASE/lib" \
./configure \
--prefix=$PROJECT_BASE \
--enable-shared \
--enable-unicode=ucs2 \
--with-ensurepip=install \
--enable-ipv6 \
--with-dbmliborder=bdb:gdbm \
--with-fpectl \
--with-system-expat \
--with-system-ffi
make
make installcd $CUR_DIRrm -rf $TEMP_CIR
这个脚本会自动下载 Python 2.7.12 ,并指定 /srv/stack/${PROJECT} 为每个 Openstack 项目的 $BASE 目录,/srv/stack/${PROJECT}/lib 为其 RPATH 目录,设定一些编译选项后编译安装 Python 到 $BASE 目录。
安装 Python 依赖
目前新打包的 Python 依赖在上面编译 Python 后通过 pip 安装。
export REQUIREMENT_FILE=debian/deb-requirements.txt# install pip requirements inside the bootstrap system$(PROJECT_PREFIX)/$(PROJECT)/bin/pip install \
-U -r $(CURDIR)/$(REQUIREMENT_FILE)
每个 Openstack 项目可以在其项目根目录下 $REQUIREMENT_FILE 中指定符合 python-pip 格式的 Python 依赖,这个文件通常是通过 pip freeze 生成的。
安装服务
在 Python 依赖安装成功后,安装项目本身到独立 Python 环境中。
# install the project inside the bootstrap system$(PROJECT_PREFIX)/$(PROJECT)/bin/python setup.py clean \
build --executable "$(PROJECT_PREFIX)/$(PROJECT)/bin/python" install
需要注意的是,在安装项目时需要指定我们自己编译的 Python 路径 --executable "$(PROJECT_PREFIX)/$(PROJECT)/bin/python" 。
其他
完成上面的步骤后,剩下只需要走正常的 Debian 打包流程,处理分包、配置文件等即可。
结语
我们使用的这个新 Python 服务 Debian 打包方案,既能享受到 Debian 包管理系统的各种便利和自动化,又能自由使用 Python PyPI 中的各种最新模块,兼顾了两者的优点又避开了各自的缺点。它已经在我们的测试环境稳定运行了几个月,趋于稳定,希望它后续能在我们服务安装部署中更好的服务我们。
更多网易技术、产品、运营经验分享请点击。
相关文章:
【推荐】 什么是高防服务器?
【推荐】 让App飞久一点
Python服务Debian打包新思路的更多相关文章
- docker容器化python服务部署(supervisor-gunicorn-flask)
docker容器化python服务部署(supervisor-gunicorn-flask) 本文系作者原创,转载请注明出处: https://www.cnblogs.com/further-furt ...
- twistd 启动Python服务
twistd 启动Python服务 shell 脚本如下: #! /usr/bin/env sh MAIN_MODULE=pdf_task.py ROOT="/var/www/pdf/&qu ...
- python开发环境配置和python源码打包生成exe可执行文件
Windows下开发环境准备 1.分别安装:python2和python32.安装Python的集成工具:Anaconda3.安装Pycharm Pycharm设置 设置: File->Sett ...
- python操作三大主流数据库(4)python操作mysql④python服务端flask和前端bootstrap框架结合实现新闻展示
python操作mysql④python服务端flask和前端bootstrap框架结合实现新闻展示 参考文档http://flask.pocoo.org/docs/0.11/http://flask ...
- Windows服务项目打包成安装包(Windows服务)-----------VS2017项目程序打包成.msi或者.exe
VS2017项目程序打包成.msi或者.exe Windows服务项目使用VS2017项目程序打包成.msi或者.exe安装包 项目打包成安装包(Windows服务) 1.安装打包插件:Microso ...
- python服务端内存泄露的处理过程
http://xiaorui.cc http://xiaorui.cc/2017/08/20/python服务端内存泄露的处理过程/
- python模块的打包
python模块的打包方法: http://blog.csdn.net/five3/article/details/7847551
- Python Windows下打包成exe文件
Python Windows 下打包成exe文件,使用PyInstaller 软件环境: 1.OS:Win10 64 位 2.Python 3.7 3.安装PyInstaller 先检查是否已安装Py ...
- Python selenium chrome打包exe后禁用控制台输出滚动日志
Python selenium chrome打包exe后,在运行的过程中,如果遇到需要input()输入时,会发现被不断滚动刷新的日志把命令行输入快速顶掉了,通过查阅资料不断实践,发现以下方法有效: ...
随机推荐
- 扫盲-wpf依赖属性
一.什么是依赖属性 依赖属性就是一种自己可以没有值,并且可以通过绑定从其他数据源获取值.依赖属性可支持WPF中的样式设置.数据绑定.继承.动画及默认值. 将所有的属性都设置为依赖属性并不总是正确的解决 ...
- linux删除目录下所有文件,但是保留文件夹
删除目录和子目录下所有rpm文件,但是保留文件夹,先cd到想要删除的目录 命令如下 find ./ -name "*.rpm" | xargs rm
- 冷门PHP函数汇总
概述 整理一些日常生活中基本用不到的PHP函数,也可以说在框架内基本都内置了,无需我们去自行使用的函数.量不多.后续在日常开发中如遇到更多的冷门,会更新本文章 sys_getloadavg 获取系统的 ...
- 一、为什么要学习Java虚拟机?
一.为什么要学习Java虚拟机? 这里我们使用举例来说明为什么要学习Java虚拟机,其实这个问题就和为什么要学习数据结构和算法是一个道理,工欲善其事,必先利其器.曾经的我经常害怕处理内存溢 ...
- 算法(Algorithms)第4版 练习 1.3.9
主要思路: 用Dijkstra的双栈算法. 遇到数字则压入数字栈中(String). 遇到运算符则压入运算符栈中(String). 遇到右括号时,从数字栈和运算法栈中弹出相应的元素,生成相应的运算表达 ...
- Contiki 源码风格
/** * \defgroup coding-style Coding style * * This is how a Doxygen module is documented - start wit ...
- macd背离的级别
1分钟的背离可以忽略不看. 5分钟的背离可以预测未来5-6个小时的股价. 15分钟级别的背离可以预测未来24小时之内的股价. 30分钟级别的背离可以做中线. 周线背离可以影响1-2年的股价. 背离级别 ...
- 系统常用VC++运行时下载地址
Microsoft Visual C++ 2005 Microsoft Visual C++ 2005 Redistributable Package (x86) https://www.micro ...
- python关于文件路径和文件名的操作
os.path.abspath(path) #返回绝对路径(包含文件名的全路径) os.path.basename(path) —— 去掉目录路径获取文件名 os.path.dirname(path) ...
- Android窗口系统第一篇---Window的类型与Z-Order确定
Android的窗口系统是UI架构很重要的一部分,数据结构比较多,细节比较多.本篇文章主要介绍窗口相关数据结构和抽象概念理解,关于[窗口部分的博客]计划如下. 1.窗口Z-Order的管理 2.应用程 ...