gunicorn Arbiter 源码解析

　　如前文所述，Arbiter是gunicorn master进程的核心。Arbiter主要负责管理worker进程，包括启动、监控、杀掉Worker进程；同时，Arbiter在某些信号发生的时候还可以热更新（reload）App应用，或者在线升级gunicorn。Arbiter的核心代码在一个文件里面，代码量也不大，源码在此：https://github.com/benoitc/gunicorn。

Arbiter主要有以下方法：

setup:

处理配置项，最重要的是worker数量和worker工作模型

init_signal：

注册信号处理函数

handle_xxx:

各个信号具体的处理函数

kill_worker，kill_workers:

向worker进程发信号

spawn_worker, spawn_workers:

fork出新的worker进程

murder_workers:

杀掉一段时间内未响应的worker进程

manage_workers:

根据配置文件的worker数量，以及当前active的worker数量，决定是要fork还是kill worker进程

reexec：

接收到信号SIGUSR2调用，在线升级gunicorn

reload：

接收到信号SIGHUP调用，会根据新的配置新启动worker进程，并杀掉之前的worker进程

sleep：

在没有信号处理的时候，利用select的timeout进行sleep，可被唤醒

wakeup：

通过向管道写消息，唤醒进程

run：

主循环

　　Arbiter真正被其他代码（Application）调用的函数只有__init__和run方法，在一句代码里：

Arbiter(self).run()

　　上面代码中的self即为Application实例，其中__init__调用setup进行配置项设置。下面是run方法伪代码

def run()

    self.init_signal()

    self.LISTENERS = create_sockets(self.cfg, self.log)

    self.manage_workers()

    while True:

        if no signal in SIG_QUEUE

            self.sleep()

        else:

            handle_signal()

关于fork子进程

　　fork子进程的代码在 spawn_worker, 源码如下：

     def spawn_worker(self):

         self.worker_age += 1

         worker = self.worker_class(self.worker_age, self.pid, self.LISTENERS,

                                    self.app, self.timeout / 2.0,

                                    self.cfg, self.log)

         self.cfg.pre_fork(self, worker)

         pid = os.fork()

         if pid != 0:

             self.WORKERS[pid] = worker

             return pid

         # Process Child

         worker_pid = os.getpid()

         try:

             util._setproctitle("worker [%s]" % self.proc_name)

             self.log.info("Booting worker with pid: %s", worker_pid)

             self.cfg.post_fork(self, worker)

             worker.init_process()

             sys.exit(0)

         except SystemExit:

             raise

         except AppImportError as e:

             self.log.debug("Exception while loading the application",

                            exc_info=True)

             print("%s" % e, file=sys.stderr)

             sys.stderr.flush()

             sys.exit(self.APP_LOAD_ERROR)

         except:

             self.log.exception("Exception in worker process"),

             if not worker.booted:

                 sys.exit(self.WORKER_BOOT_ERROR)

             sys.exit(-1)

         finally:

             self.log.info("Worker exiting (pid: %s)", worker_pid)

             try:

                 worker.tmp.close()

                 self.cfg.worker_exit(self, worker)

             except:

                 self.log.warning("Exception during worker exit:\n%s",

                                   traceback.format_exc())

Arbiter.spawn_worker

　　主要流程：

（1）加载worker_class并实例化（默认为同步模型 SyncWorker）

（2）父进程（master进程）fork之后return，之后的逻辑都在子进程中运行

（3）调用worker.init_process 进入循环，worker的所有工作都在这个循环中

（4）循环结束之后，调用sys.exit(0)

（5）最后，在finally中，记录worker进程的退出

下面是我自己写的一点代码，把主要的fork流程简化了一下

 # prefork.py

 import sys

 import socket

 import select

 import os

 import time

 def do_sub_process():

     pid = os.fork()

     if pid < 0:

         print 'fork error'

         sys.exit(-1)

     elif pid > 0:

         print 'fork sub process %d'  % pid

         return

     # must be child process

     time.sleep(1)

     print 'sub process will exit', os.getpid(), os.getppid()

     sys.exit(0)

 def main():

     sub_num = 2

     for i in range(sub_num):

         do_sub_process()

     time.sleep(10)

     print 'main process will exit', os.getpid()

 if __name__ == '__main__':

     main()

在测试环境下输出：

　　fork sub process 9601

　　fork sub process 9602

　　sub process will exit 9601 9600

　　sub process will exit 9602 9600

　　main process will exit 9600

　　需要注意的是第20行调用了sys.exit, 保证子进程的结束，否则会继续main函数中for循环，以及之后的逻辑。注释掉第19行重新运行，看输出就明白了。

关于kill子进程

　　master进程要kill worker进程就很简单了，直接发信号，源码如下:

     def kill_worker(self, pid, sig):

         """\

         Kill a worker

         :attr pid: int, worker pid

         :attr sig: `signal.SIG*` value

          """

         try:

             os.kill(pid, sig)

         except OSError as e:

             if e.errno == errno.ESRCH:

                 try:

                     worker = self.WORKERS.pop(pid)

                     worker.tmp.close()

                     self.cfg.worker_exit(self, worker)

                     return

                 except (KeyError, OSError):

                     return

             raise

关于sleep与wakeup

　　我们再来看看Arbiter的sleep和wakeup。Arbiter在没有信号需要处理的时候会"sleep"，当然，不是真正调用time.sleep，否则信号来了也不能第一时间处理。这里得实现比较巧妙，利用了管道和select的timeout。看代码就知道了

        def sleep(self):

        """\

        Sleep until PIPE is readable or we timeout.

        A readable PIPE means a signal occurred.

        """

            ready = select.select([self.PIPE[0]], [], [], 1.0) # self.PIPE = os.pipe()

            if not ready[0]:

                return

            while os.read(self.PIPE[0], 1):

                pass

　　代码里面的注释写得非常清楚，要么PIPE可读立即返回，要么等待超时。管道可读是因为有信号发生。这里看看pipe函数

　　os.pipe(): Create a pipe. Return a pair of file descriptors (r,w) usable for reading and writing, respectively.

　　那我们看一下什么时候管道可读：肯定是往管道写入的东西，这就是wakeup函数的功能

        def wakeup(self):

            """

            Wake up the arbiter by writing to the PIPE

            """

            os.write(self.PIPE[1], b'.')

最后附上Arbiter的信号处理：

QUIT, INT: Quick shutdown
TERM: Graceful shutdown. Waits for workers to finish their current requests up to the graceful timeout.
HUP: Reload the configuration, start the new worker processes with a new configuration and gracefully shutdown older workers. If the application is not preloaded (using the --preloadoption), Gunicorn will also load the new version.
TTIN: Increment the number of processes by one
TTOU: Decrement the number of processes by one
USR1: Reopen the log files
USR2: Upgrade the Gunicorn on the fly. A separate TERM signal should be used to kill the old process. This signal can also be used to use the new versions of pre-loaded applications.
WINCH: Gracefully shutdown the worker processes when Gunicorn is daemonized.

reference：

http://docs.gunicorn.org/en/stable/

http://docs.gunicorn.org/en/stable/signals.html

gunicorn Arbiter 源码解析的更多相关文章

gunicorn syncworker 源码解析
gunicorn支持不同的worker类型,同步或者异步,异步的话包括基于gevent.基于eventlet.基于Aiohttp(python版本需要大于3.3),也有多线程的版本.下面是gunico ...
【原】Android热更新开源项目Tinker源码解析系列之三：so热更新
本系列将从以下三个方面对Tinker进行源码解析: Android热更新开源项目Tinker源码解析系列之一:Dex热更新 Android热更新开源项目Tinker源码解析系列之二:资源文件热更新 A ...
【原】Android热更新开源项目Tinker源码解析系列之一：Dex热更新
[原]Android热更新开源项目Tinker源码解析系列之一:Dex热更新 Tinker是微信的第一个开源项目,主要用于安卓应用bug的热修复和功能的迭代. Tinker github地址:http ...
【原】Android热更新开源项目Tinker源码解析系列之二:资源文件热更新
上一篇文章介绍了Dex文件的热更新流程,本文将会分析Tinker中对资源文件的热更新流程. 同Dex,资源文件的热更新同样包括三个部分:资源补丁生成,资源补丁合成及资源补丁加载. 本系列将从以下三个方 ...
多线程爬坑之路-Thread和Runable源码解析之基本方法的运用实例
前面的文章:多线程爬坑之路-学习多线程需要来了解哪些东西?(concurrent并发包的数据结构和线程池,Locks锁,Atomic原子类) 多线程爬坑之路-Thread和Runable源码解析前面 ...
jQuery2.x源码解析(缓存篇)
jQuery2.x源码解析(构建篇) jQuery2.x源码解析(设计篇) jQuery2.x源码解析(回调篇) jQuery2.x源码解析(缓存篇) 缓存是jQuery中的又一核心设计,jQuery ...
Spring IoC源码解析——Bean的创建和初始化
Spring介绍 Spring(http://spring.io/)是一个轻量级的Java 开发框架,同时也是轻量级的IoC和AOP的容器框架,主要是针对JavaBean的生命周期进行管理的轻量级容器 ...
jQuery2.x源码解析(构建篇)
jQuery2.x源码解析(构建篇) jQuery2.x源码解析(设计篇) jQuery2.x源码解析(回调篇) jQuery2.x源码解析(缓存篇) 笔者阅读了园友艾伦 Aaron的系列博客< ...
jQuery2.x源码解析(设计篇)
jQuery2.x源码解析(构建篇) jQuery2.x源码解析(设计篇) jQuery2.x源码解析(回调篇) jQuery2.x源码解析(缓存篇) 这一篇笔者主要以设计的角度探索jQuery的源代 ...

随机推荐

Java多线程学习之线程池源码详解
0.使用线程池的必要性在生产环境中,如果为每个任务分配一个线程,会造成许多问题: 线程生命周期的开销非常高.线程的创建和销毁都要付出代价.比如,线程的创建需要时间,延迟处理请求.如果请求的到达率非常 ...
你应该学会的Postman用法
postman这个神器相信大家都用过,程序员作为非专业的测试人员,非常需要这么一款简单轻量级的restful测试工具,但是不知道你是否知道,postman的强大之处不只是测试一下接口,还有其他非常赞的 ...
python调用c代码2
1.生成动态链接库 [root@typhoeus79 c]# more head.c #include <stdio.h> #include <stdlib.h> typede ...
pt-stalk
1.名词解释 Collect forensic data about MySQL when problems occur 在问题发生的时候采集现场数据 pt-stalk waits for a tri ...
IIS解决CPU和内存占用率过高的问题
发现进程中的w3wp占用率过高. 经过查询,发现如下: w3wp.exe是在IIS(因特网信息服务器)与应用程序池相关联的一个进程,如果你有多个应用程序池,就会有对应的多个w3wp.exe的进程实例运 ...
Webstorm下安装ESLint检测JS代码
今天配置下Webstorm下面的Eslint, 先看下本地安装的Node,NPM版本,2017-11-23日这个节点最新版本. >node -v v8.9.1 >npm -v 使用Webs ...
No bean named 'sqlSessionFactory' is defined
其实程序给出这个错误已经很明确了,说你的sqlSessionFactory是未定义的. 首先你要查看一下自己的web.xml文件是否配置了application*.xml <!--设置sprin ...
smartClient 1--框架介绍
一.是什么(以下简称SC) smartClient 是一个基于web技术的开发框架,主要包括: 一个无需安装的 Ajax/HTML5 客户端引擎 UI组件和服务(采用富客户端RIA)--- 提 ...
DLL的导出函数重定向机制
曾经,调试时跟进HeapAlloc,结果发现直接进入到ntdll的RtlAllocateHeap中,感到很有趣,就使用Dependency Walker查看kernel32.dll的导出函数,结果发现 ...
Android Imageview 图片居左居右,自定义圆角
android:scaleType="fitStart" 图片靠左不变形显示, android:scaleType=”fitEnd” 图片靠右显示,不变形. 半透明andr ...

gunicorn Arbiter 源码解析

gunicorn Arbiter 源码解析的更多相关文章

随机推荐

热门专题