gunicorn

https://blog.csdn.net/jailman/article/details/78496522

gunicorn工作原理

Gunicorn“绿色独角兽”是一个被广泛使用的高性能的Python WSGI UNIX HTTP服务器，移植自Ruby的独角兽（Unicorn ）项目,使用pre-fork worker模式，具有使用非常简单，轻量级的资源消耗，以及高性能等特点。

Gunicorn 服务器作为wsgi app的容器，能够与各种Web框架兼容（flask，django等）,得益于gevent等技术，使用Gunicorn能够在基本不改变wsgi app代码的前提下，大幅度提高wsgi app的性能。

总体结构

gunicorn pre-fork worker模型中有一个管理进程以及几个的工作进程。管理进程:master，工作进程:worker。（以下代码中为了方面理解，均去除了一些干扰代码）

master通过pre-fork的方式创建多个worker:

def spawn_worker(self):

    self.worker_age += 1

    #创建worker。请注意这里的app 对象并不是真正的wsgi app对象，而是gunicorn的app

    #对象。gunicorn的app对象负责import我们自己写的wsgi app对象。

    worker = self.worker_class(self.worker_age, self.pid, self.LISTENERS,

                                self.app, self.timeout / 2.0,

                                self.cfg, self.log)

    pid = os.fork()

    if pid != 0:  #父进程，返回后继续创建其他worker，没worker后进入到自己的消息循环

        self.WORKERS[pid] = worker

        return pid

    # Process Child

    worker_pid = os.getpid()

    try:

        ..........

        worker.init_process() #子进程，初始化woker，进入worker的消息循环，

        sys.exit(0)

    except SystemExit:

        raise

    ............

在worker.init_process()函数中，worker中gunicorn的app对象会去import 我们的wsgi app。也就是说，每个woker子进程都会单独去实例化我们的wsgi app对象。每个worker中的swgi app对象是相互独立、互不干扰的。

manager维护数量固定的worker：

def manage_workers(self):

        if len(self.WORKERS.keys()) < self.num_workers:

            self.spawn_workers()

        while len(workers) > self.num_workers:

            (pid, _) = workers.pop(0)

            self.kill_worker(pid, signal.SIGQUIT)

创建完所有的worker后，worker和master各自进入自己的消息循环。
master的事件循环就是收收信号，管理管理worker进程，而worker进程的事件循环就是监听网络事件并处理（如新建连接，断开连接，处理请求发送响应等等），所以真正的连接最终是连到了worker进程上的。（注：有关这种多进程模型的详细介绍，可以参考http://blog.csdn.net/largetalk/article/details/7939080）

worker

woker有很多种，包括：ggevent、geventlet、gtornado等等。这里主要分析ggevent。

每个ggevent
worker启动的时候会启动多个server对象：worker首先为每个listener创建一个server对象（注：为什么是一组listener,因为gunicorn可以绑定一组地址,每个地址对于一个listener），每个server对象都有运行在一个单独的gevent
pool对象中。真正等待链接和处理链接的操作是在server对象中进行的。

#为每个listener创建server对象。

    for s in self.sockets:

        pool = Pool(self.worker_connections) #创建gevent pool

        if self.server_class is not None:

           #创建server对象

            server = self.server_class(

                s, application=self.wsgi, spawn=pool, log=self.log,

                handler_class=self.wsgi_handler, **ssl_args)

        .............

        server.start() #启动server，开始等待链接，服务链接

        servers.append(server)

        .........

上面代码中的server_class实际上是一个gevent的WSGI SERVER的子类：

class PyWSGIServer(pywsgi.WSGIServer):

    base_env = BASE_WSGI_ENV

需要注意的是构造PyWSGIServer的参数：

self.server_class(

                s, application=self.wsgi, spawn=pool, log=self.log,

                handler_class=self.wsgi_handler, **ssl_args)

这些参数中s是server用来监听链接的套接字。spawn是gevent的协程池。application即是我们的wsgi app（通俗点讲就是你用 flask 或者 django写成的app），我们的app就是通过这种方式交给gunicorn的woker去跑的。 handler_class是gevent的pywsgi.WSGIHandler子类。

当所有server对象创建完毕后，worker需要定时通知manager，否则会被认为是挂掉了。

while self.alive:

            self.notify()

            .......

这个地方的notify机制设计的比较有趣，每个worker有个与之对应的tmp file，每次notify的时候去操作一下这个tmp file（比如通过os.fchmod），这个tmp file的last update的时间戳就会更新。而manager则通过检查每个worker对应的temp file的last update的时间戳，来判断这个进程是否是挂掉的。

WSGI SERVER

真正等待链接和处理链接的操作是在gevent的WSGIServer 和 WSGIHandler中进行的。
最后再来看一下gevent的WSGIServer 和 WSGIHandler的主要实现:

WSGIServer 的start函数里面调用start_accepting来处理到来的链接。在start_accepting里面得到接收到的套接字后调用do_handle来处理套接字：

def do_handle(self, *args):

    spawn = self._spawn

    spawn(self._handle, *args)

可以看出，WSGIServer 实际上是创建一个协程去处理该套接字，也就是说在WSGIServer 中，一个协程单独负责一个HTTP链接。协程中运行的self._handle函数实际上是调用了WSGIHandler的handle函数来不断处理http 请求：

def handle(self):

    try:

        while self.socket is not None:

            result = self.handle_one_request()#处理HTTP请求

            if result is None:

                break

            if result is True:

                continue

            self.status, response_body = result

            self.socket.sendall(response_body)#发送回应报文

          ..............

在handle函数的循环内部，handle_one_request函数首先读取HTTP 请求，初始化WSGI环境，然后最终调用run_application函数来处理请求：

def run_application(self):

    self.result = self.application(self.environ, self.start_response)

    self.process_result()

在这个地方才真正的调用了我们的 app。

总结：gunicorn 会启动一组 worker进程，所有worker进程公用一组listener，在每个worker中为每个listener建立一个wsgi server。每当有HTTP链接到来时，wsgi server创建一个协程来处理该链接，协程处理该链接的时候，先初始化WSGI环境，然后调用用户提供的app对象去处理HTTP请求。

gunicorn的更多相关文章

python Gunicorn
1. 简介 Gunicorn(Green Unicorn)是给Unix用的WSGI HTTP 服务器,它与不同的web框架是非常兼容的.易安装.轻.速度快. 2. 示例代码1 def app(envi ...
Debian7下lnmp+gunicorn部署Django运行环境
首先安装lnmp,安装方法见lnmp.org wget -c http://soft.vpser.net/lnmp/lnmp1.3-full.tar.gz && tar zxf lnm ...
apache(nginx)+django+virutalenv(virtualenvwrapper)+gunicorn+supervisor配置高效web环境
前言 django的调试模式配置简单,用于测试十分方便,但众所周知,这个只适合于调试,生产上运行效率十分低下. 后来考虑用nginx+uwsgi的模式进行,但之前配置过apache+wsgi的方式,感 ...
Gunicorn 和 Nginx
Web Application Deployment Using Nginx Nginx is a very high performant web server / (reverse)-proxy. ...
Gunicorn 问题
Does Gunicorn suffer from the thundering herd problem? The thundering herd problem occurs when many ...
Gunicorn 文档翻译
服务器模式 Gunicorn 基于 pre-fork 模式,这意味着有一个主进程管理工作的子进程.主进程对客户端的工作业务有了解.所有的请求和响应都是工作子进程处理. 主进程主进程是一个简单的循环, ...
nginx+gunicorn+supervisor+flask @ centos
/etc/nginx/conf.d/default.conf server { listen 80 default_server; server_name 127.0.0.1; #charset ko ...
Gunicorn + Django 部署
1. 下载gunicorn pip install gunicorn 2. 运行 gunicorn AutoSa.wsgi:application ## AutoSa为我project的名字,后面的不 ...
Flask + Gunicorn + Nginx 部署
最近很多朋友都在问我关于 Flask 部署的问题,说实在的我很乐意看到和回答这样的问题,至少证明了越来越多人开始用 Flask 了. 之前我曾发表过一篇在 Ubuntu 上用 uwsgi + ngin ...
virtualenv 环境下 Nginx + Flask + Gunicorn+ Supervisor 搭建 Python Web
在这篇文章里,我们将搭建一个简单的 Web 应用,在虚拟环境中基于 Flask 框架,用 Gunicorn 做 wsgi 容器,用 Supervisor 管理进程,然后使用 Python 探针来监测应 ...

随机推荐

unity, access sprite of UGUI Image
首先需要using UnityEngine.UI; 然后调用下面语句就不报错了: Image.GetComponent<Image>().sprite 参考:http://answers. ...
codility上的问题(34) Fluorum 2014
好久没写codility的题了.一来没时间,二来有的题目不太好分析.这个题比較有意思,我还没有给出很严格的证明.
Monotone Chain Convex Hull(单调链凸包)
Monotone Chain Convex Hull(单调链凸包)算法伪代码: //输入:一个在平面上的点集P //点集 P 按先x后y 的递增排序 //m 表示共a[i=0...m]个点,ans为 ...
PHP学习笔记（16）AJAX无刷新技术--深入理解
Ajax里的onreadystatechange的作用是什么发送一个请求后,客户端无法确定什么时候会完成这个请求,所以需要用事件机制来捕获请求的状态,XMLHttpRequest对象提供了onrea ...
HTML5七巧板canvas绘图
<!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <m ...
迅搜sdk试用
1. sdk支持PHP 2. 针对mysql的某个库的某个表??进行索引,简单的说就是一个project,需要对应一个配置文件: 3. 分索引服务与搜索服务两个,另带中文分词功能:索引数据会有演示,但 ...
mui时间选择器选择今天以后的时间
<script type="text/javascript"> (function($) { $.init(); // var result = $('#result' ...
圆角带箭头的提示框css实现
css是一个很强大的东西,很多网页效果,我们可以通过css直接实现.今天给大家分享的是一个用css实现的圆角带箭头的提示框. 效果如下图: 这一个样式主要涉及到了css的边框样式border的运用和定 ...
EasyUI combobox 加载JSON数据《一》
Action返回 JSON 格式如下: jsonResult = { total=7,rows=[ {TEXT=技术支持, ID=402894ca4419acf1014419b148a10000}, ...
Temporal Ensembling for Semi-Supervised Learning
Laine, Samuli, and Timo Aila. "Temporal Ensembling for Semi-Supervised Learning." arXiv pr ...