今天凑空研究了下Supervisord,这是一款linux进程管理工具,使用python开发,主要用于在后台维护进程(类似master守护进程),可以实现监控进程的状态、自动重启进程等操作,便于一些服务的维护与监控。

安装Supervisord

由于是用python开发的,因此使用pip安装最为方便。

1
$ pip install supervisor

说明:安装完成之后多了3个工具:echo_supervisord_conf、supervisorctl和supervisord。

Supervisord配置文件

首先可以使用echo_supervisord_conf命令获取supervisor配置模板:

1
echo_supervisord_conf > supervisord.conf

说明:该命令在当前目录下创建了一个文件名为supervisord.conf的配置文件,编辑配置文件:

1
vim supervisord.conf

来看看默认配置文件中的主要配置项:(还有一些配置不常用,可以忽略)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
[unix_http_server]
file=/tmp/supervisor.sock ; UNIX socket 文件,supervisorctl 会使用
;chmod=0700 ; socket 文件的 mode,默认是 0700
;chown=nobody:nogroup ; socket 文件的 owner,格式: uid:gid
 
;[inet_http_server] ; HTTP 服务器,提供 web 管理界面
;port=127.0.0.1:9001 ; Web 管理后台运行的 IP 和端口,如果开放到公网,需要注意安全性
;username=user ; 登录管理后台的用户名
;password=123 ; 登录管理后台的密码
 
[supervisord]
logfile=/tmp/supervisord.log ; 日志文件,默认是 $CWD/supervisord.log
logfile_maxbytes=50MB ; 日志文件大小,超出会 rotate,默认 50MB
logfile_backups=10 ; 日志文件保留备份数量默认 10
loglevel=info ; 日志级别,默认 info,其它: debug,warn,trace
pidfile=/tmp/supervisord.pid ; pid 文件
nodaemon=false ; 是否在前台启动,默认是 false,即以 daemon 的方式启动
minfds=1024 ; 可以打开的文件描述符的最小值,默认 1024
minprocs=200 ; 可以打开的进程数的最小值,默认 200
 
; the below section must remain in the config file for RPC
; (supervisorctl/web interface) to work, additional interfaces may be
; added by defining them in separate rpcinterface: sections
[rpcinterface:supervisor]
supervisor.rpcinterface_factory = supervisor.rpcinterface:make_main_rpcinterface
 
[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ; 通过 UNIX socket 连接 supervisord,路径与 unix_http_server 部分的 file 一致
;serverurl=http://127.0.0.1:9001 ; 通过 HTTP 的方式连接 supervisord
 
; 包含其他的配置文件
[include]
files = relative/directory/*.ini ; 可以是 *.conf 或 *.ini

运行以下命令启动supervisord进程,可测试supervisord是否安装成功并执行。

1
supervisord -c supervisord.conf

查看系统进程中是否多了一个supervisord:

1
ps -aux | grep supervisord

配置Program

  program就是用来配置监控不同的应用程序进程的,推荐每个应用程序单独写一个program配置文件,然后在supervisord.conf中通过include加载所有应用程序的配置。
这里拿创建一个celery进程为例,首先在supervisord.conf最后一行写入:

1
2
3
;加载/etc/supervisor/目录下所有的配置文件
[include]
files = /etc/supervisor/*.conf

然后创建/etc/supervisor目录,并到目录下创建/etc/supervisor/celery_touchscan.conf文件,写入:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
;program名称,随便写,但不要重复,是program的唯一标识
[program:celery_touchscan]
;指定运行目录
directory=/root/TouchScanV2/
;运行目录下执行命令
command=celery -A scan worker --queue=touchscan --pidfile="./log/pid.txt" --logfile="./log/scan.log" -c 10
;进程名称
process_name=%(program_name)s_%(process_num)02d
 
;启动设置
numprocs=1 ;进程数,注意:(celery进程数量,不是work数量,相当于执行了10个command命令,而不是在celery中指定-c 为10)
autostart=true ;当supervisor启动时,程序将会自动启动
autorestart=true ;自动重启(当work被kill了之后会重新启动)
;运行程序的用户
;user=root
;startsecs=1 ;程序重启时候停留在runing状态的秒数
;startretries=10 ;启动失败时的最多重试次数
 
;停止信号,默认TERM
;中断:INT (类似于Ctrl+C)(kill -INT pid),退出后会将写文件或日志(推荐)
;终止:TERM (kill -TERM pid)
;挂起:HUP (kill -HUP pid),注意与Ctrl+Z/kill -stop pid不同
;从容停止:QUIT (kill -QUIT pid)
stopsignal=INT

重启supervisord进程:

1
supervisorctl -c supervisord.conf reload

  此时查看系统上的进程,发现创建了一个supervisord守护进程,10个celery的work进程(celery的work进程数量取决于command命令中的-c参数以及配置文件中的numprocs参数,numprocs参数是指运行几次command命令,而在celery命令行中指定了需要运行的work数量)


说明:此时如果手动kill掉celery的work进程,会发现celery的work进程会被supervisord自动重启,只有当supervisord守护进程被kill以后,才能真正kill掉celery的work进程。

supervisord命令行操作

启动supervisord进程

1
supervisord -c supervisord.conf

关闭supervisord进程

1
supervisorctl -c supervisord.conf shutdown #注意这里将supervisord进程关闭,但通过supervisord启动的进程没有关闭

重启supervisord进程

1
supervisorctl -c supervisord.conf reload

查看进程状态

1
supervisorctl

效果如下:

每列分别代表:programe名称、进程名称,进程状态、进程id,运行时间

更多supervisorctl命令

1
2
3
4
5
6
$ supervisorctl status
$ supervisorctl stop celery_touchscan # celery_touchscan是一个program的名称
$ supervisorctl start celery_touchscan
$ supervisorctl restart celery_touchscan
$ supervisorctl reread
$ supervisorctl update

说明:可以直接在系统shell中执行,也可以先执行supervisorctl,进入supervisorctl_shell中执行相应的命令。

针对Python环境

如果项目使用了python的pyenv模块来设置环境,则supervisord配置文件中需要指定python环境的路径。其中有两种方式指定程序使用的Python环境:

  • command使用绝对路径。
  • 通过environment配置PYTHONPATH。

使用supervisord注意点

子进程问题

有时候用Supervisor托管的程序还会有子进程,如果只杀死主进程,子进程就可能变成孤儿进程。通过以下这两项配置来确保所有子进程都能正确停止:

1
2
stopasgroup=true
killasgroup=true

配置更新

每次修改supervisord配置文件后,需要重启supervisord进程。

后台程序问题

Supervisor只能管理在前台运行的程序,所以如果应用程序有后台运行的选项,需要关闭。

supervisord与定时任务

supervisord主要用来管理进程,而不是调度任务,因此如果有定时任务的需求,跟结合crontab一起使用。当然如果是管理celery服务,可以结合celery自身的定时任务功能,具体可移步:https://thief.one/2017/08/25/1/

supervisord xml-rpc

前面介绍的都是在本地利用supervisord管理进程,那么如何实现在远处管理服务器上的进程呢?supervisord工具提供了相关的api。首先需要在配置文件中打开相关配置信息:

1
2
3
4
[inet_http_server] ; HTTP 服务器,提供 web 管理界面
port=127.0.0.1:9001 ; Web 管理后台运行的 IP 和端口,如果开放到公网,需要注意安全性
username=user ; 登录管理后台的用户名
password=123 ; 登录管理后台的密码

然后启动supervisord后,可以用web界面管理进程,打开http://127.0.0.1:9001。当然也提供了rpc接口,可供远程调用,代码样例如下:

1
2
3
4
5
6
7
8
9
import xmlrpclib
server = xmlrpclib.Server('http://user:123@127.0.0.1:9111/RPC2') #连接rpc服务
# print server.system.listMethods() # 查询api支持的方法
# print server.supervisor.getState() # 获取supervisord进程状态
# print server.supervisor.shutdown() # 关闭supervisor,慎用
# print server.supervisor.restart() # 重启supervisor
print server.supervisor.getProcessInfo(process_name) # 获取指定进程信息
print server.supervisor.startProcess(process_name) # 启动指定进程
print server.supervisor.stopProcess(process_name) # 暂停指定进程

api操作比较简单,具体的方法使用文档可以参考:http://supervisord.org/api.html#xml-rpc

参考

https://pypi.org/project/supervisor/
https://www.jianshu.com/p/9559ab642d88
http://liyangliang.me/posts/2015/06/using-supervisor/

Supervisord管理进程实践的更多相关文章

  1. supervisord管理进程详解

    supervisord管理进程详解 supervisor配置详解(转) 官网 Linux后台进程管理利器:supervisor supervisor使用详解

  2. python 实用案例 supervisord管理进程详解

    Supervisor是由python语言编写,基于linux操作系统的一款服务器管理工具,用以监控服务器的运行,发现问题能立即自动预警及自动重启等功能.Supervisor类似于monit,monit ...

  3. 用Supervisord管理Python进程

    http://feilong.me/2011/03/monitor-processes-with-supervisord Supervisord是用Python实现的一款非常实用的进程管理工具,类似于 ...

  4. 使用supervisor管理进程

    Supervisor (http://supervisord.org) 是一个用 Python 写的进程管理工具,可以很方便的用来启动.重启.关闭进程(不仅仅是 Python 进程).除了对单个进程的 ...

  5. Supervisor管理进程

    Supervisor管理进程 转载 2016年04月14日 18:26:45 标签: supervisord 28344 Supervisor重新加载配置启动新的进程 liaojie 发布于 1年前, ...

  6. Django与supervisor 管理进程

    1.前言 在Django项目中,我们需要用到一些独立于Django框架外的脚本.这样一些脚本可能需要独立的持续运行,且具有很强的可维护性,这个时候supervisor就可以排上用场了. 基于pytho ...

  7. supervisor管理进程工具配置

    Supervisor(http://supervisord.org/)是用Python开发的一个client/server服务,是Linux/Unix系统下的一个进程管理工具,不支持Windows系统 ...

  8. supervisor管理进程 superlance对进程状态报警

    supervisor介绍 首先,介绍一下supervisor.Supervisor(http://supervisord.org/)是用Python开发的一个client/server服务,是Linu ...

  9. 在Docker里使用(支持镜像继承的)supervisor管理进程(转)

    这篇文章是受 dockboard 之托帮忙翻译的与 docker 有关的技术文章.译自 Using Supervisor with Docker to manage processes (suppor ...

随机推荐

  1. Ubuntu 14.04 安装配置备忘录

    完全在 Linux 下工作,大概有3年时间了. 之前都是用 Windows, 而把 Linux 装在虚拟机里,现在反过来,把 Windows 装在了虚拟机里,只是因为偶尔还要用网银的缘故. 以我这几年 ...

  2. Redis入门篇(安装与启动)

    一.Redis介绍 Redis是NoSql的一种,在弄清楚Redis是个什么玩意之前,先了解下NoSql是什么.1.什么是NoSql NoSql,全名:Not Only Sql,是一种非关系型数据库, ...

  3. Java8之使用Optional进行Null处理

    Optional类这是Java 8新增的一个类,用以解决程序中常见的NullPointerException异常问题,本篇文章将详细介绍Optional类,以及如何用它消除代码中的null检查. 1. ...

  4. ASP.NET Core 和 ASP.NET Framework 共享 Identity 身份验证

    .NET Core 已经热了好一阵子,1.1版本发布后其可用性也越来越高,开源.组件化.跨平台.性能优秀.社区活跃等等标签再加上"微软爸爸"主推和大力支持,尽管现阶段对比.net ...

  5. 07 YAPI/基础设施 - DevOps之路

    07 YAPI/基础设施 - DevOps之路 文章Github地址,欢迎start:https://github.com/li-keli/DevOps-WiKi 简介 YApi 是一个可本地部署的. ...

  6. SQL 显示表名显示列名

    显示表名:show 表名: 显示列(Field)名:show columns from 表名:

  7. log4j打印堆栈信息

    原文地址:https://blog.csdn.net/xianyu_0418/article/details/6043174 大家都知道,网站在运行的过程中,打印必要的log对记录网站的运行情况.从而 ...

  8. Centos7 ssh配置RSA证书登录

    修改sshd配置文件 vim /etc/ssh/sshd_config #增加以下三项 RSAAuthentication yes PubkeyAuthentication yes Authorize ...

  9. H5 35-背景平铺属性

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  10. python中换行,'\r','\n'及'、'\r\n'

    '\r'的本意是回到行首,'\n'的本意是换行. 所以回车相当于做的是'\r\n'或者'\n\r'.'\r'就是换行并回行首, '\n'就是换行并回行首,用'\r\n'表示换行并回行首. window ...