python 多线程并发threading & 任务队列Queue

https://docs.python.org/3.7/library/concurrency.html
python程序默认是单线程的，也就是说在前一句语句执行完之前后面的语句不能继续执行
先感受一下线程，一般情况下：

def testa():

    sleep(1)

    print "a"

def testb():

    sleep(1)

    print "b"

testa()

testb()
#先隔出一秒打印出a，再过一秒打出b

但是如果用了threading的话：

ta = threading.Thread(target=testa)

tb = threading.Thread(target=testb)

for t in [ta,tb]:

    t.start()

for t in [ta,tb]:

    t.join()

print "DONE"

#输出是ab或者ba（紧贴着的）然后空一行再来DONE的结果。

得到这样的结果是因为这样的，在start之后，ta首先开始跑，但是主线程（脚本本身）没有等其完成就继续开始下一轮循环，然后tb也开始了，在之后的一段时间里，ta和tb两条线程（分别代表了testa和testb这两个过程）共同执行。相对于一个个迭代而言，这样做无疑是大大提高了运行的速度。

　　Thread类为线程的抽象类，其构造方法的参数target指向一个函数对象，即该线程的具体操作。此外还可以有args=<tuple>来给target函数传参数。需要注意的是当传任何一个序列进去的话Thread会自动把它分解成单个单个的元素然后分解传给target函数。我估计在定义的时候肯定是*args了。

　　join方法是个很tricky的东西，至今还不是很清楚地懂这是个什么玩意儿。join([timeout])方法阻塞了主线程，直到调用此方法的子线程完成之后主线程才继续往下运行。（之前我糊里糊涂地把join就紧紧接在start后面写了，如果这么写了的话那么多线程在速度上就毫无优势，和单线程一样了= =）。而像上面这个示例一样，先一个遍历把所有线程都启动起来，再用一个遍历把所有线程都join一遍似乎是比较通行的做法。

关于线程锁

　　多线程程序涉及到一个问题，那就是当不同线程要对同一个资源进行修改或利用时会出现混乱，所以有必要引入线程锁。

　　可以通过Thread.Lock类来创建简单的线程锁。lock = threading.Lock()即可。在某线程start之前，让lock.acquire()，且lock在acquire()之后不能再acquire，否则会报错。当线程结束后调用lock.release()来释放锁就好了。一般而言，有锁的多线程场景可以提升一部分效率，但在写文件等时机下会有阻塞等待的情况。相比之下，无所多线程场景可以进一步提升效率，但是可能会引起读写冲突等问题，所以要慎用。一定要确认各个线程间没有共同的资源之类的问题后再实行无锁多线程。

　　●　　以上的包装线程的方式是一种面向过程的方法，下面介绍一下如何面向对象地来抽象线程

　　面向对象地抽象线程需要自定义一个类继承Thread类。比如自定义class MyThread(Thread)。这个类的一个实例就是代表了一个线程，然后通过重载这个类中的run方法（是run，不是start！！但start的动作确实就是调用run）来执行具体的操作。此时锁可以作为一个构造方法的参数，将一个锁传进不同的实例中以实现线程锁控制。比如：

#方法二：从Thread继承，并重写run()

class MyThread(threading.Thread):

    def __init__(self,arg):

        super(MyThread, self).__init__()#注意：一定要显式的调用父类的初始化函数。

        self.arg=arg

    def run(self):#定义每个线程要运行的函数

        time.sleep(1)

        print 'the arg is:%s\r' % self.arg

for i in xrange(4):

    t =MyThread(i)

    t.start()

print 'main thread end!'

Thread类还有以下的一些方法，自定义的类也可以调用

　　　　getName()

　　　　setName(...)　　//其实Thread类在构造方法中有一个name参数，可以为相应的线程取一个名字。这两个方法就是相关这个名字属性的

　　　　isAlive()　　一个线程从start()开始到run()结束的过程中没有异常，则其实alive的。

　　　　setDaemon(True/False)　　是否设置一个线程为守护线程。当你设置一个线程为守护线程之后，程序不会等待这个线程结束再退出程序，可参考http://blog.csdn.net/u012063703/article/details/51601579

　　●　　除了Thread类，threading中还有以下一些属性，简单介绍一下：

　　　　Timer类，Timer(int,target=func)　　和Thread类类似，只不过它在int秒过后才以target指定的函数开始线程运行

　　　　currentThread()　　获得当前线程对象

　　　　activeCount()　　获得当前活动的线程总个数

　　　　enumerate()　　获得所有活动线程的列表

　　　　settrace(func)　　设置一跟踪函数，在run执行前执行

　　　　setprofile(func)　　设置一跟踪函数，在run执行完毕之后执行

Queue用于建立和操作队列，常和threading类一起用来建立一个简单的线程队列。

　　首先，队列有很多种，根据进出顺序来分类，可以分成

　　　　Queue.Queue(maxsize)　　FIFO（先进先出队列）

　　　　Queue.LifoQueue(maxsize)　　LIFO（先进后出队列）

　　　　Queue.PriorityQueue(maxsize)　　为优先度越低的越先出来

　　　　如果设置的maxsize小于1，则表示队列的长度无限长

　　FIFO是常用的队列，其一些常用的方法有：

　　　　Queue.qsize()　　返回队列大小

　　　　Queue.empty()　　判断队列是否为空

　　　　Queue.full()　　判断队列是否满了

　　　　Queue.get([block[,timeout]])　　从队列头删除并返回一个item，block默认为True，表示当队列为空却去get的时候会阻塞线程，等待直到有有item出现为止来get出这个item。如果是False的话表明当队列为空你却去get的时候，会引发异常。在block为True的情况下可以再设置timeout参数。表示当队列为空，get阻塞timeout指定的秒数之后还没有get到的话就引发Full异常。

　　　　Queue.put(...[,block[,timeout]])　　向队尾插入一个item，同样若block=True的话队列满时就阻塞等待有空位出来再put，block=False时引发异常。同get的timeout，put的timeout是在block为True的时候进行超时设置的参数。

　　　　Queue.task_done()　　从场景上来说，处理完一个get出来的item之后，调用task_done将向队列发出一个信号，表示本任务已经完成

　　　　Queue.join()　　监视所有item并阻塞主线程，直到所有item都调用了task_done之后主线程才继续向下执行。这么做的好处在于，假如一个线程开始处理最后一个任务，它从任务队列中拿走最后一个任务，此时任务队列就空了但最后那个线程还没处理完。当调用了join之后，主线程就不会因为队列空了而擅自结束，而是等待最后那个线程处理完成了。

　　结合threading和Queue可以构建出一个简单的生产者-消费者模型，比如：

import threading

    import Queue

    import time

    class worker(threading.Thread):

     def __init__(self,queue):

      threading.Thread.__init__(self)

      self.queue=queue

      self.thread_stop=False  

     def run(self):

      while not self.thread_stop:

       print("thread%d %s: waiting for tast" %(self.ident,self.name))

       try:

        task=q.get(block=True, timeout=20)#接收消息

       except Queue.Empty:

        print("Nothing to do!i will go home!")

        self.thread_stop=True

        break

       print("task recv:%s ,task No:%d" % (task[0],task[1]))

       print("i am working")

       time.sleep(3)

       print("work finished!")

       q.task_done()#完成一个任务

       res=q.qsize()#判断消息队列大小

       if res>0:

        print("fuck!There are still %d tasks to do" % (res))  

     def stop(self):

      self.thread_stop = True  

    if __name__ == "__main__":

     q=Queue.Queue(3)

     worker=worker(q)

     worker.start()

     q.put(["produce one cup!",1], block=True, timeout=None)#产生任务消息

     q.put(["produce one desk!",2], block=True, timeout=None)

     q.put(["produce one apple!",3], block=True, timeout=None)

     q.put(["produce one banana!",4], block=True, timeout=None)

     q.put(["produce one bag!",5], block=True, timeout=None)

     print("***************leader:wait for finish!")

     q.join()#等待所有任务完成

     print("***************leader:all task finished!")

输出是这样的

thread139958685849344 Thread-1: waiting for tast 1

    task recv:produce one cup! ,task No:1

    i am working

    work finished!

    fuck!There are still 3 tasks to do

    thread139958685849344 Thread-1: waiting for tast 1

    task recv:produce one desk! ,task No:2

    i am workingleader:wait for finish!

    work finished!

    fuck!There are still 3 tasks to do

    thread139958685849344 Thread-1: waiting for tast 1

    task recv:produce one apple! ,task No:3

    i am working

    work finished!

    fuck!There are still 2 tasks to do

    thread139958685849344 Thread-1: waiting for tast 1

    task recv:produce one banana! ,task No:4

    i am working

    work finished!

    fuck!There are still 1 tasks to do

    thread139958685849344 Thread-1: waiting for tast 1

    task recv:produce one bag! ,task No:5

    i am working

    work finished!

    thread139958685849344 Thread-1: waiting for tast 1

     ***************leader:all task finished!

    Nothing to do!i will go home!

上例中并没有性能的提升（毕竟还是只有一个线程在跑）。线程队列的意义并不是进一步提高运行效率，而是使线程的并发更加有组织。可以看到，在增加了线程队列之后，程序对于线程的并发数量就有了控制。新线程想要加入队列开始执行，必须等一个既存的线程完成之后才可以。举个例子，比如

for i in range(x):

  t = MyThread(queue)

  t.start()

x在这里是个变量，我们不知道这个循环会触发多少线程并发，如果多的话就会很冒险。但是有了队列之后，把一个队列作为所有线程构建线程对象时的一个参数，让线程必须按照这个队列规定的大小来执行的话，就不担心过多线程带来的危险了。

python 多线程并发threading & 任务队列Queue的更多相关文章

【Python】多线程并发threading & 任务队列Queue
threading python程序默认是单线程的,也就是说在前一句语句执行完之前后面的语句不能继续执行(不知道我理解得对不对) 先感受一下线程,一般情况下: def testa(): sleep(1 ...
用Queue控制python多线程并发数量
python多线程如果不进行并发数量控制,在启动线程数量多到一定程度后,会造成线程无法启动的错误. 下面介绍用Queue控制多线程并发数量的方法(python3). # -*- coding: utf ...
Python多线程（threading模块）
线程(thread)是操作系统能够进行运算调度的最小单位.它被包含在进程之中,是进程中的实际运作单位.一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务. ...
Python 多线程并发程序设计与分析
多线程并发程序设计与分析 by:授客 QQ:1033553122 1．技术难点分析与总结难点1:线程运行时,运行顺序不固定难点2:同一段代码,再不加锁的情况下,可能被多个线程同时执行,这会造成很多 ...
Python多线程笔记(三)，queue模块
尽管在Python中可以使用各种锁和同步原语的组合编写非常传统的多线程程序,但有一种首推的编程方式要优于其他所有编程方式即将多线程程序组织为多个独立人物的集合,这些任务之间通过消息队列进行通信 que ...
Python多线程并发的误区
由于项目要做一个并发测试,由于断言的东西较多,决定手写脚本.于是用python写了脚本: def test_method(thread_no): print("%s===test_metho ...
Python多线程（3）——Queue模块
Queue模块支持先进先出(FIFO)队列,支持多线程的访问,包括一个主要的类型(Queue)和两个异常类(exception classes). Python 2 中的Queue模块在Python ...
python多线程与threading模块
python多线程与_thread模块中介绍了线程的基本概念以及_thread模块的简单示例.然而,_thread模块过于简单,使得我们无法用它来准确地控制线程,本文介绍threading模块,它提 ...
python多线程--优先级队列（Queue）
Python的Queue模块中提供了同步的.线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue.这些队列都实现 ...

随机推荐

bzoj 1055: [HAOI2008]玩具取名【区间dp】
不难想,就是处理起来比较麻烦设f[i][j][k]为是否可以把区间(i,j)合并为k,初始状态是f[i][j][s[i]]=1,转移的话另一段枚举长度x,向(i-x,j),(i,j+x)转移把四个 ...
第一篇(那些JAVA程序BUG中的常见单词)
The local variable xxx may not have been initialized. 局部变量xxx可能尚未初始化 local variable 局部变量 initialized ...
python之对堆栈、队列处理操作（转载+个人看法）
参考链接:https://blog.csdn.net/u010786109/article/details/40649827 python实现堆栈操作堆栈是一个后进先出的数据结构,其工作方式就像一堆 ...
C++中的四种强制类型转换符详解
阅读目录 C++即支持C风格的类型转换,又有自己风格的类型转换.C风格的转换格式很简单,但是有不少缺点的: 转换太过随意,可以在任意类型之间转换.你可以把一个指向const对象的指针转换成指向非con ...
题解报告：hdu 1398 Square Coins（母函数或dp）
Problem Description People in Silverland use square coins. Not only they have square shapes but also ...
js和 php 介绍
转 1. 在公司项目的改造当中,经常会遇到js与php的函数互调的情况,而实际上JS与php的设计者是不提倡这两种语言直接进行调用的,一个是客户端语言,一个服务端语言,两者之间的交互往往靠的是ajax ...
P1478 陶陶摘苹果（升级版）
题目描述又是一年秋季时,陶陶家的苹果树结了n个果子.陶陶又跑去摘苹果,这次她有一个a公分的椅子.当他手够不着时,他会站到椅子上再试试. 这次与NOIp2005普及组第一题不同的是:陶陶之前搬凳子,力 ...
QML中使用相对路径
QML里有三种路径: 默认使用URL路径. "qrc:///filepath".这用来索引资源文件. "file:///绝对路径".这用来索引本地文件系统中的文 ...
InChatter系统之服务器开发（一）
服务器端是整个消息系统的中枢,类似与人类的大脑.没有他,根本无法实现客户端之间的交流,为什么呢?这也涉及到我们的系统涉及,在服务器端,每个客户端的标识数据都会在服务器端进行保存,在这种情况下,当某一个 ...
Farseer.net轻量级ORM开源框架 V1.x 入门篇：存储过程数据操作
导航目录:Farseer.net轻量级ORM开源框架目录上一篇:Farseer.net轻量级ORM开源框架 V1.x 入门篇:存储过程实体类映射下一篇:Farseer.net轻量级ORM ...

python 多线程并发threading & 任务队列Queue

python 多线程并发threading & 任务队列Queue的更多相关文章

随机推荐

热门专题