Python-多线程之消费者模式和GIL全局锁

一.生产者和消费者模式

　　什么是生产者消费者模式

　　　　生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题。生产者和消费者彼此之间不直接通讯，而通过阻塞队列来进行通讯，

　　　　所以生产者生产完数据之后不用等待消费者处理，直接扔给阻塞队列，消费者不找生产者要数据，而是直接从阻塞队列里取，阻塞队列就相当

　　　　于一个缓冲区，平衡了生产者和消费者的处理能力。基于队列实现生产者消费者模型

　　定义：

　　　　在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题。

　　　　模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度。

案例：

　　厨师做包子和顾客吃包子问题。

# 一对多 一个大厨对多个顾客

import threading

import queue

import time

q = queue.Queue(maxsize=10)

#生产者

def producer(name):

    count = 1

    while True:

        q.put("包子%d"%count)

        print("生产了包子%d"%count)

        count += 1

        time.sleep(0.8)

#消费者

def consumer(name):

    count = 1

    while True:

        print("[%s]取到了[%s]并且吃了它。。。"%(name,q.get()))

        time.sleep(2)

if __name__ == '__main__':

    p  = threading.Thread(target=producer,args=("刘大厨",))

    a = threading.Thread(target=consumer,args=("A",))

    b = threading.Thread(target=consumer,args=("B",))

    p.start()

    a.start()

    b.start()

# 多对多 多个大厨对多个顾客

import threading

import queue

import time,random

q = queue.Queue(maxsize=10)

count = 1

#生产者

def producer(name):

    global count

    while True:

        # if mutex.acquire():

        #     q.put("包子%d"%count)

        #     print("%s生产了包子%d"%(name,count))

        #     count += 1

        #     time.sleep(random.random()*10)

        #     mutex.release()

        q.put("包子%d" % count)

        print("%s生产了包子%d" % (name, count))

        count += 1

        time.sleep(random.random() * 10)

#消费者

def consumer(name):

    count = 1

    while True:

        print("[%s]取到了[%s]并且吃了它。。。"%(name,q.get()))

        time.sleep(random.random() * 10)

if __name__ == '__main__':

    mutex = threading.Lock()

    p1 = threading.Thread(target=producer,args=("刘大厨",))

    p2 = threading.Thread(target=producer,args=("李大厨",))

    a = threading.Thread(target=consumer,args=("A",))

    b = threading.Thread(target=consumer,args=("B",))

    c = threading.Thread(target=consumer,args=("C",))

    d = threading.Thread(target=consumer,args=("D",))

    p1.start()

    p2.start()

    a.start()

    b.start()

    c.start()

    d.start()

队列：

　　队列的使用，Python的Queue模块中提供了同步的、线程安全的队列类

　　 FIFO（先入先出)队列格式：q = queue.Queue()

　　 LIFO（后入先出）队列格式： q = queue.LifoQueue()

　　 priority 优先级队列格式： q = queue.PriorityQueue()

　　　　向队列中添加数据 q.put(1,'a'), 1代表优先级,越小优先级越高，也可以设置成负数即优先级越小，越先出来

　　这些队列都实现了锁原语（可以理解为原子操作，即要么不做，要么就做完），能够在多线程中直接使用。可以使用队列来实现线程间的同步。

为什么要使用生产者和消费者模式

　　在线程世界里，生产者就是生产数据的线程，消费者就是消费数据的线程。在多线程开发当中，如果生产者处理速度很快，而消费者处理速度很慢，

　　那么生产者就必须等待消费者处理完，才能继续生产数据。同样的道理，如果消费者的处理能力大于生产者，那么消费者就必须等待生产者。为了

　　解决这个问题于是引入了生产者和消费者模式。

二.GIL(全局解释器锁)

　　在单线程中数2亿个数和在两个线程中分别数1亿个数，哪个效率更高？速度更快？

　　用事实来证明：

from threading import Thread

from multiprocessing import Process

import time

#计数

def two_hundred_million():

    start_time = time.time()

    i = 0

    for _ in range(200000000):

        i = i + 1

    end_time = time.time()

    print("Total time:{}".format(end_time - start_time))

#数1亿

def one_hundred_million():

    start_time = time.time()

    i = 0

    for _ in range(100000000):

        i = i + 1

    end_time = time.time()

    print("Total time:{}".format(end_time - start_time))

if __name__ == "__main__":

    #单线程---主线程

    #two_hundred_million() #Total time:19.491114616394043

    #多线程

    # for _ in range(2):

    #     t = Thread(target=one_hundred_million) #Total time:18.768073320388794

    #     t.start()                              #Total time:18.906081438064575

    #多进程

    # for _ in range(2):

    #     p = Process(target=one_hundred_million)  #Total time:11.364650011062622

    #     p.start()                                #Total time:11.398651838302612

答案已经很明显了：单线程为20秒左右，两个线程分别也是20秒左右

原因很简单：GIL(全局解释器锁)

　　 Python 代码的执行是由 Python 虚拟机（又名解释器主循环）进行控制的。Python 在设计时是这样考虑的，在主循环中同时只能有一个控制线程在执行，

　　　　就像单核 CPU 系统中的多进程一样。内存中可以有许多程序，但是在任意给定时刻只能有一个程序在运行。

　　同理，尽管 Python 解释器中可以运行多个线程，但是在任意给定时刻只有一个线程会被解释器执行。

　　对 Python 虚拟机的访问是由全局解释器锁（GIL）控制的。这个锁就是用来保证同时只能有一个线程运行的。在多线程环境中，Python 虚拟机将按照下面

　　　　所述的方式执行。

　　　　1. 设置 GIL。

　　　　2. 切换进一个线程去运行。

　　　　3. 执行下面操作之一。

　　　　4. 指定数量的字节码指令。

　　　　5. 线程主动让出控制权（可以调用 time.sleep(0)来完成）。

　　　　6. 把线程设置回睡眠状态（切换出线程）。

　　　　7. 解锁 GIL。

　　　　8. 重复上述步骤。

如何避免受到GIL的影响

　　使用进程

　　以上例子很明显就可以看出答案：一个单进程为20秒左右，两个进程分别为10秒左右

　　用multiprocess替代Thread

　　multiprocess库的出现很大程度上是为了弥补thread库因为GIL而低效的缺陷。它完整的复制了一套thread所提供的接口方便迁移。唯一的不同就是它使用

了多进程　而不是多线程。每个进程有自己的独立的GIL，因此也不会出现进程之间的GIL争抢。

　　当然multiprocess也不是万能良药。它的引入会增加程序实现时线程间数据通讯和同步的困难。就拿计数器来举例子，如果我们要多个线程累加同一个变量

对于thread来说，申明一个global变量，用thread.Lock的context包裹住三行就搞定了。而multiprocess由于进程之间无法看到对方的数据，只能通过在主线程申

明一个Queue，put再get或者用share memory的方法。这个额外的实现成本使得本来就非常痛苦的多线程程序编码，变得更加痛苦了。

Python-多线程之消费者模式和GIL全局锁的更多相关文章

python GIL 全局锁，多核cpu下的多线程性能究竟如何？
python GIL 全局锁,多核cpu下的多线程性能究竟如何?GIL全称Global Interpreter Lock GIL是什么? 首先需要明确的一点是GIL并不是Python的特性,它是在实现 ...
[ Python - 11 ] 多线程及GIL全局锁
1. GIL是什么? 首先需要明确的一点是GIL并不是python的特性, 它是在实现python解析器(Cpython)时所引入的一个概念. 而Cpython是大部分环境下默认的python执行环境 ...
java+反射+多线程+生产者消费者模式+读取xml(SAX)入数据库mysql-【费元星Q9715234】
java+反射+多线程+生产者消费者模式+读取xml(SAX)入数据库mysql-[费元星Q9715234] 说明如下,不懂的问题直接我[费元星Q9715234] 1.反射的意义在于不将xml tag ...
并发编程-线程-死锁现象-GIL全局锁-线程池
一堆锁死锁现象 (重点) 死锁指的是某个资源被占用后,一直得不到释放,导致其他需要这个资源的线程进入阻塞状态. 产生死锁的情况对同一把互斥锁加了多次一个共享资源,要访问必须同时具备多把锁,但是这 ...
python并发编程-多线程实现服务端并发-GIL全局解释器锁-验证python多线程是否有用-死锁-递归锁-信号量-Event事件-线程结合队列-03
目录结合多线程实现服务端并发(不用socketserver模块) 服务端代码客户端代码 CIL全局解释器锁****** 可能被问到的两个判断与普通互斥锁的区别验证python的多线程是否有用需 ...
TCP并发、GIL全局锁、多线程讨论
TCP实现并发 #client客户端 import socket client = socket.socket() client.connect(('127.0.0.1',8080)) while T ...
Java实现多线程生产者消费者模式的两种方法
生产者消费者模式:生产者和消费者在同一时间段内共用同一存储空间,生产者向空间里生产数据,而消费者取走数据.生产者生产一个,消费者消费一个,不断循环. 第一种实现方法,用BlockingQueue阻塞队 ...
java多线程生产者消费者模式
package de.bvb; /** * 生产者消费者模式 * 通过 wait() 和 notify() 通信方法实现 * */ public class Test1 { public static ...
java实现多线程生产者消费者模式
1.概念生产者消费者模式就是通过一个容器来解决生产者和消费者的强耦合问题.生产者和消费者彼此之间不直接通讯,而通过阻塞队列来进行通讯,所以生产者生产完数据之后不用等待消费者处理,直接扔给阻塞队列,消 ...

随机推荐

新手如何学习Java——Java学习路线图
推荐初学者阅读:新手如何学习Java——Java学习路线图
过滤access日志前5条数据
cat /usr/local/nginx/logs/access.log|awk '{print $1}'|sort|uniq -c|sort -n -r|head -5 找不到的话可以find查找a ...
详解 Tomcat 的连接数与线程池
前言在使用tomcat时,经常会遇到连接数.线程数之类的配置问题,要真正理解这些概念,必须先了解Tomcat的连接器(Connector). 在前面的文章详解Tomcat配置文件server. ...
Java中构造函数传参数在基本数据类型和引用类型之间的区别
Java中构造函数传参数在基本数据类型和引用类型的区别如果构造函数中穿的参数为基本数据类型,如果在函数中没有返回值,在调用的时候不会发生改变:而如果是引用类型,改变的是存储的位置,所有不管有没有返回 ...
kali域名解析错误解决
浏览器出现不能上网的的现象,推测是DNS解析有问题,想要修改DNS vim /etc/resolv.conf nameserver 202.96.134.133 nameserver 114.114. ...
Mysql 数据库创建与删除(基础2)
创建数据库语法: 注意:创建数据库时可以指定编码(如: create database mydb123 default charset utf8; ) pyvip@Vip:~$ mysql -uxl ...
SOA 是什么
SOA 英文:Service-Oriented Architecture,面向服务的架构. 是一种面向通用集成服务的.松耦合的架构实现方式,是web时代服务发展的产物: 使用"分层" ...
E-R图学习笔记
E-R图也称实体-联系图(Entity Relationship Diagram),提供了表示实体类型.属性和联系的方法,用来描述现实世界的概念模型. 方法编辑 E-R方法是“实体-联系方法”( ...
jquery mobil 和页面适应
<meta name="viewport" content="width=device-width" />
五 shutil模块
高级的文件.文件夹.压缩包处理模块 shutil.copyfileobj(fsrc, fdst[, length])将文件内容拷贝到另一个文件中 1 import shutil 2 3 shuti ...

Python-多线程之消费者模式和GIL全局锁

Python-多线程之消费者模式和GIL全局锁的更多相关文章

随机推荐

热门专题