python threading模块使用以及python多线程操作的实践(使用Queue队列模块)

今天花了近乎一天的时间研究python关于多线程的问题，查看了大量源码自己也实践了一个生产消费者模型，所以把一天的收获总结一下。

由于GIL(Global Interpreter Lock)锁的关系,纯的python代码处理一般逻辑的确无法活动性能上的极大提升，但是在处理需要等待外部资源返回或多用户的应用程序中，多线程仍然可以作为一个比较好的工具来进行使用。

python提供了两个模块thread和threading 来支持python的多线程操作。通俗的讲一般现在我们只使用threading模块来编程了，thread模块定义了很多原始行为，更接近底层，而threading模块抽象了thread模块可用性更好，同时提供更多特性。

现在创建线程的通用方法一般是创建一个类并且继承threading.Thread，然后重写其中的__init__和run()方法。更多详情可以参考threading模块代码内注释以及代码。下面直接看个例子。

import time

import threading

class Test(threading.Thread):

    def __init__(self, name, delay):

        super(Test, self).__init__()

        self.name = name

        self.delay = delay

    def run(self):

        print "%s delay for %s seconds" % (self.name, self.delay)

        time.sleep(self.delay)

        c = 0

        while True:

            print "This is thread %s on line %s" % (self.name, c)

            c += 1

            if c == 3:

                print "End of thread %s" % self.name

                break

t1 = Test('Thread1', 5)

t2 = Test('Thread2', 5)

t1.start()

print 'Wait t1 to end'

t1.join()

t2.start()

t2.join()

print 'End of main'

注意一下这一句：

super(Test, self).__init__()

这是按照模块要求，必须初始化父类的__init__函数所以使用了super()

其他并没有值得多少的地方，

创建线程方便的实例化自己写的继承threading.Thread的类然后传入对应的参数。

最后使用xxx.start()来运行线程。使用xxx.join()来阻塞线程。

特别注意的是。继承自Threading类的子类还有一个daemon参数，如果这个参数适用setDaemon()方法置为True之后，主线程将不会等待子线程都结束之后才结束，而是自己运行完之后就结束，这种方式相当粗暴。如果将daemon参数设置为False的话，主线成将会等待所有子线程结束之后再结束。daemon属性可以通过使用isDaemon()方法获取一个boolean值。

更进一步的，我必须介绍一下线程之间的同步和互斥问题。下面引用《计算机操作系统》中的介绍。

当线程并发执行时，由于资源共享和线程协作，使用线程之间会存在以下两种制约关系。

（1）间接相互制约。一个系统中的多个线程必然要共享某种系统资源，如共享CPU，共享I/O设备，所谓间接相互制约即源于这种资源共享，打印机就是最好的例子，线程A在使用打印机时，其它线程都要等待。

（2）直接相互制约。这种制约主要是因为线程之间的合作，如有线程A将计算结果提供给线程B作进一步处理，那么线程B在线程A将数据送达之前都将处于阻塞状态。

间接相互制约可以称为互斥，直接相互制约可以称为同步，对于互斥可以这样理解，线程A和线程B互斥访问某个资源则它们之间就会产个顺序问题——要么线程A等待线程B操作完毕，要么线程B等待线程操作完毕，这其实就是线程的同步了。因此同步包括互斥，互斥其实是一种特殊的同步。

在一段时间内只允许一个线程访问的资源就称为临界资源或独占资源，计算机中大多数物理设备，进程中的共享变量等待都是临界资源，它们要求被互斥的访问。每个进程中访问临界资源的代码称为临界区。

这里为了介绍这种稍微复杂的概念。再列出一个生产消费者的例子使用到了Queue队列。

# coding:utf-8

import Queue

import time

import random

import threading

# write_lock = threading.Lock()                                                 # 创建primitive锁对象用于控制输出

class Producer(threading.Thread):

    # q传递一个队列参数, con传递了一个链接, name传递了一个名字

    def __init__(self, q, con, name):

        super(Producer, self).__init__()

        self.q = q

        self.con = con

        self.name = name

        print "Producer " + self.name + "Started"

    def run(self):

        while True:

            # 锁对象常用的acquire获得锁方法和release释放锁方法

            # 这里使用的是Thread的Condition对象

            self.con.acquire()

            if self.q.full():

                print 'Queue is full, producer wait!'

                # 手动挂起,并且只能在获得Lock的情况下才可以使用 否则会触发RuntimeError

                # 调用wait()会释放Lock 直到该线程被notify(),notifyall()或超时该线程又重新获得Lock

                self.con.wait()

            else:

                value = random.randint(0, 10)

                print self.name + " put " + str(value) + "into queue"

                self.q.put((self.name+":"+str(value)))                    # 放置到队列中

                # 通知消费者,notify通知其他线程,被挂起的线程接到通知后会开始运行

                # 默认通知一个正在等待该condition的线程,最多唤醒n个线程 必须在获得Lock的情况下使用否则会报错.

                self.con.notify()

                self.con.release()                                            # 释放锁对象

class Consumer(threading.Thread):

    def __init__(self, q, con, name):

        super(Consumer, self).__init__()

        self.q = q

        self.con = con

        self.name = name

        print "Consumer " + self.name + "started\n"

    def run(self):

        while True:

            # Condition常用的acquire获得条件和release释放锁方法

            self.con.acquire()

            if self.q.empty():

                print 'queue is empty, consumer wait!'

                self.con.wait()

            else:

                value = self.q.get()                                            # 从队列中取消息

                print self.name + " get " + value + "from queue"

                # 发送消息通知生产者

                self.con.notify()

                self.con.release()                                              # 释放锁对象

                print 'queue still have ' + str(q.qsize()) + 'task\n'

if __name__ == "__main__":

    q = Queue.Queue(10)

    # 使用Condition对象可以在某些事件触发或达到特定的条件后才处理数据.

    con = threading.Condition()

    # 两个生产者

    p1 = Producer(q, con, "P1")

    p2 = Producer(q, con, "P2")

    c1 = Consumer(q, con, "C1")

    p2.start()

    p1.start()

    c1.start()

可以看到这是一个典型的生产消费者模型。两个生产者负责往队列中添加数据，一个消费者复杂从队列里面拿出数据处理掉然后继续拿出继续处理，直到队列为空然后挂起等待生产者生产。

要解决同步和互斥其实最简单的办法就是引入一个锁的机制。在一个线程访问一个共享资源的时候，就将这个资源锁住，直到该线程访问完毕之后再释放给其他线程进行访问。这样就保证了，在一个线程处理一个共享资源的情况下，不会因为其他线程也在处理同一个资源而造成混乱。

可以看到这里我申明了con = threading.Condition() 申明了一个条件对象。而它拥有acquire()/release()/notify()/wait() 等方法。分别是获取锁，释放锁，唤醒操作和等待操作。上面用到了这四种方法。可以看到我们在生产者Producer中，先获取了一个锁对象，然后来判断队列是否已满，如果满了则不再生产，并且挂起当前线程并且暂时释放掉获取的锁。直到收到消费者的notify()，并且获得消费者释放的锁。

这样就很清楚了，通过锁的机制以及挂起的机制。我们可以更安全的进行多线程操作。其实在这个例子中，queue本身是线程安全的。不需要额外的同步机制。所以我们可以完全不需要条件锁。也就是说我们不需要制造一个Condition对象，直接使用队列就可以轻松实现多线程的消费者和生产者模型了。

# coding:utf-8

import Queue

import time

import random

import threading

# write_lock = threading.Lock()                                                 # 创建primitive锁对象用于控制输出

class Producer(threading.Thread):

    # q传递一个队列参数, con传递了一个链接, name传递了一个名字

    def __init__(self, q, name):

        super(Producer, self).__init__()

        self.q = q

        # self.con = con

        self.name = name

        print "Producer " + self.name + "Started"

    def run(self):

        while True:

            # 锁对象常用的acquire获得锁方法和release释放锁方法

            # 这里使用的是Thread的Condition对象

            # self.con.acquire()

            if self.q.full():

                print 'Queue is full, producer wait!'

                # 手动挂起,并且只能在获得Lock的情况下才可以使用 否则会触发RuntimeError

                # 调用wait()会释放Lock 直到该线程被notify(),notifyall()或超时该线程又重新获得Lock

                # self.con.wait()

            else:

                value = random.randint(0, 10)

                print self.name + " put " + str(value) + "into queue"

                self.q.put((self.name+":"+str(value)))                    # 放置到队列中

                # 通知消费者,notify通知其他线程,被挂起的线程接到通知后会开始运行

                # 默认通知一个正在等待该condition的线程,最多唤醒n个线程 必须在获得Lock的情况下使用否则会报错.

                # self.con.notify()

                # self.con.release()                                            # 释放锁对象

class Consumer(threading.Thread):

    def __init__(self, q, name):

        super(Consumer, self).__init__()

        self.q = q

        # self.con = con

        self.name = name

        print "Consumer " + self.name + "started\n"

    def run(self):

        while True:

            # Condition常用的acquire获得锁方法和release释放锁方法

            # self.con.acquire()

            if self.q.empty():

                print 'queue is empty, consumer wait!'

                # self.con.wait()

            else:

                value = self.q.get()                                            # 从队列中取消息

                print self.name + " get " + value + "from queue"

                # 发送消息通知生产者

                # self.con.notify()

                # self.con.release()                                              # 释放锁对象

                print 'queue still have ' + str(q.qsize()) + 'task\n'

if __name__ == "__main__":

    q = Queue.Queue(10)

    # 使用Condition对象可以在某些事件触发或达到特定的条件后才处理数据.

    # con = threading.Condition()

    # 两个生产者

    p1 = Producer(q, "P1")

    p2 = Producer(q, "P2")

    c1 = Consumer(q, "C1")

    p2.start()

    p1.start()

    c1.start()

以上内容参考链接:

1. python threading模块文档翻译： http://my.oschina.net/lionets/blog/194577?fromerr=pbWOeveo

2. 多线程7经典线程与互斥总结：http://blog.csdn.net/dazhong159/article/details/7927034

3. 《编写高质量代码改善python程序的91个建议》第48和49建议。

python threading模块使用以及python多线程操作的实践(使用Queue队列模块)的更多相关文章

Python第十五天 datetime模块 time模块 thread模块 threading模块 Queue队列模块 multiprocessing模块 paramiko模块 fabric模块
Python第十五天 datetime模块 time模块 thread模块 threading模块 Queue队列模块 multiprocessing模块 paramiko模块 fab ...
Python -- queue队列模块
一简单使用 --内置模块哦 import Queuemyqueue = Queue.Queue(maxsize = 10) Queue.Queue类即是一个队列的同步实现.队列长度可为无限或者有限. ...
Python 源码分析：queue 队列模块
起步 queue 模块提供适用于多线程编程的先进先出(FIFO)数据结构.因为它是线程安全的,所以多个线程很轻松地使用同一个实例. 源码分析先从初始化的函数来看: 从这初始化函数能得到哪些信息呢?首 ...
Python守护进程、进程互斥锁、进程间通信ICP（Queue队列）、生产者消费者模型
知识点一:守护进程守护进程:p1.daemon=True 守护进程其实就是一个“子进程“,守护=>伴随守护进程会伴随主进程的代码运行完毕后而死掉进程:当父进程需要将一个任务并发出去执行,需 ...
queue队列模块
import Queue myqueue = Queue.Queue(maxsize = 10) Queue.Queue类即是一个队列的同步实现.队列长度可为无限或者有限.可通过Queue的构造函数的 ...
Python笔记：threading（多线程操作）
Python的线程操作在旧版本中使用的是thread模块,在Python27和Python3中引入了threading模块,同时thread模块在Python3中改名为_thread模块,thread ...
一行 Python 实现并行化 -- 日常多线程操作的新思路
春节坐在回家的火车上百无聊赖,偶然看到 Parallelism in one line 这篇在 Hacker News 和 reddit 上都评论过百的文章,顺手译出,enjoy:-) http:// ...
python用parammiko模块实现linux的远程操作
parammiko 可以实现远程的带密码登录,解决ssh远程登陆需要交互的问题 (当然很多其他的,如tcl也可以).但这个用python做比较简单 1.parammiko 的安装 1.1.依赖模块 ...
python操作MySQL数据库的三个模块
python使用MySQL主要有两个模块,pymysql(MySQLdb)和SQLAchemy. pymysql(MySQLdb)为原生模块,直接执行sql语句,其中pymysql模块支持python ...

随机推荐

sh脚本文件的运行
sh脚本文件的运行mac终端下运行shell脚本 1.写好自己的脚本,比如test-bash.sh 2.打开终端执行,方法一: 输入命令 ./test-bash.sh , 方法二:直接把 aa.s ...
Intellij Idea免费激活方法(转)
文章转自 http://blog.csdn.net/u013772876/article/details/70763759 1.填入下面的license server: http://intelli ...
mybatis配置时出现org.apache.ibatis.binding.BindingException: Invalid bound statement (not found)
如果出现: org.apache.ibatis.binding.BindingException: Invalid bound statement (not found) 一般的原因是Mapper i ...
Spring Security 用户授权原理分析
本文基于 spring-security-core-5.1.1 和 tomcat-embed-core-9.0.12. 本文接着Spring Security 用户认证原理分析进行分析,此时用户已完成 ...
<转>jmeter（十四）HTTP请求之content-type
本博客转载自:http://www.cnblogs.com/dinghanhua/p/5646435.html 个人感觉不错,对jmeter最常用的取样器http请求需要用到的信息头管理器做了很好的解 ...
Image Restoration[Deep Image Prior]
0.背景这篇论文是2017年11月29号第一次提交到arxiv并紧接着30号就提交了V2版本的. 近些年DCNN模型在图像生成和修复上面表现很好,大部分人认为好的原因主要是由于网络基于大量的图片训练 ...
linux 资料
吾爱linux 摘自传智播客
Java8中的HashMap分析
本篇文章是网上多篇文章的精华的总结,结合自己看源代码的一些感悟,其中线程安全性和性能测试部分并未做实践测试,直接是“拿来”网上的博客的. 哈希表概述哈希表本质上一个数组,数组中每一个元素称为一个箱子 ...
vue 中使用 async/await 将 axios 异步请求同步化处理
1. axios 常规用法: export default { name: 'Historys', data() { return { totalData: 0, tableData: [] } }, ...
.net core实践系列之短信服务-Sikiro.SMS.Api服务的实现
前言上篇<.net core实践系列之短信服务-架构设计>介绍了我对短信服务的架构设计,同时针对场景解析了我的设计理念.本篇继续讲解Api服务的实现过程. 源码地址:https://gi ...

python threading模块使用 以及python多线程操作的实践(使用Queue队列模块)

python threading模块使用 以及python多线程操作的实践(使用Queue队列模块)的更多相关文章

随机推荐

热门专题

python threading模块使用以及python多线程操作的实践(使用Queue队列模块)

python threading模块使用以及python多线程操作的实践(使用Queue队列模块)的更多相关文章