摘录 python核心编程

上节介绍的thread模块,是不支持守护线程的。当主线程退出的时候,所有的子线程都将终止,不管他们是否仍在工作。

本节开始,我们开始介绍python的另外多线程模块threading,该模块支持守护线程,其工作方式:守护线程一般是一个等待客户端请求的服务器。如果没有客户端请求,守护线程就是空闲的。如果把一个线程设置为守护线程,就表示这个线程是不重要的,进程退出时不需要等待这个线程执行完成。

如果主线程准备退出的时候,不需要等待某些子线程完成,就可以为这些子线程设置守护线程标记。该标记值为真的时候,标示线程是不重要的,或者说该线程只是用来等待客户端请求而不做其他任何事情。

使用下面的语句:thread.daemon=True 可以将一个线程设置为守护线程。同样的也可以通过这个值来查看线程的守护状态。一个新的子线程会继承父线程的守护标记。整个python程序(也可以称作主线程)将在所有的非守护线程退出之后才退出。

threading模块除了Thread类之外,还包括许多好用的同步机制:

对象 描述
Thread 表示一个执行线程的对象
Lock 锁对象
RLock 可重入锁对象,使单一线程可以(再次)获得已持有的锁(递归锁)
Condition 条件变量对象,使得一个线程等待另外一个线程满足特定的条件,比如改变状态或者某个数据值
Event  条件变量的通用版本,任意数量的线程等待某个事件的发生,在该事件发生后所有的线程都将被激活
Semaphore 为线程间的有限资源提供一个计数器,如果没有可用资源时会被阻塞
BoundedSemaphore 于Semaphore相似,不过它不允许超过初始值
Timer 于Thread类似,不过它要在运行前等待一定时间
Barrier 创建一个障碍,必须达到指定数量的线程后才可以继续

其中,Thread类是threading模块的主要执行对象。

下面是Thread类的属性和方法列表:

属性 描述
Thread类属性
name 线程名
ident 线程的标识符
daemon 布尔值,表示这个线程是否是守护线程
Thread类方法
__init__(group=None,target=None,name=None,args=(),kwargs={},verbose=None,daemon=None) 实例化一个线程对象,需要一个可调用的target对象,以及参数args或者kwargs。还可以传递name和group参数。daemon的值将会设定thread.daemon的属性
start() 开始执行该线程
run() 定义线程的方法。(通常开发者应该在子类中重写)
join(timeout=None) 直至启动的线程终止之前一直挂起;除非给出了timeout(单位秒),否则一直被阻塞
getName() 返回线程名(该方法已被弃用)
setName() 设定线程名(该方法已弃用)
isAlive 布尔值,表示这个线程是否还存活(驼峰式命名,python2.6版本开始已被取代)
isDaemon() 布尔值,表示是否是守护线程(已经弃用)
setDaemon(布尔值) 在线程start()之前调用,把线程的守护标识设定为指定的布尔值(已弃用)

使用Thread类,可以有多种方法创建线程:

  • 创建Thread类的实例,传递一个函数
  • 创建Thread类的实例,传递一个可调用的类实例
  • 派生Thread类的子类,并创建子类的实例

一般的,我们会采用第一种或者第三种方法。如果需要一个更加符合面向对象的接口时,倾向于选择第三种方法,否则就用第一种方法吧。

第一种方法:创建Thread类,传递一个函数

下面的脚本中,我们先实例化Thread类,并传递一个函数(及其参数),当线程执行的时候,函数也会被执行:

#!/usr/bin/env/ python

import threading
from time import sleep,ctime
#不再把4秒和2秒硬性的编码到不同的函数中,而是使用唯一的loop()函数,并把这些常量放进列表loops中
loops=[4,2] def loop(nloop,nsec):
print('开始循环',nloop,'at:',ctime())
sleep(nsec)
print('循环',nloop,'结束于:',ctime()) def main():
print('程序开始于:',ctime())
threads=[]
nloops=range(len(loops)) for i in nloops:
t=threading.Thread(target=loop,args=(i,loops[i])) #循环 实例化2个Thread类,传递函数及其参数,并将线程对象放入一个列表中
threads.append(t) for i in nloops:
threads[i].start() #循环 开始线程 for i in nloops:
threads[i].join() #循环 join()方法可以让主线程等待所有的线程都执行完毕。 print('任务完成于:',ctime()) if __name__=='__main__':
main()

执行结果:

PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepC.py
程序开始于: Thu Mar 29 21:35:13 2018
开始循环 0 at: Thu Mar 29 21:35:13 2018
开始循环 1 at: Thu Mar 29 21:35:13 2018
循环 1 结束于: Thu Mar 29 21:35:15 2018
循环 0 结束于: Thu Mar 29 21:35:17 2018
任务完成于: Thu Mar 29 21:35:17 2018

和上节的thread模块相比,不同点在于:实现同样的效果,thread模块需要锁对象,而threading模块的Thread类不需要。实例化Thread(调用Thread())和调用thread.start_new_thread()的最大区别就是新线程不会立即执行!这是一个非常有用的同步功能,尤其在我们不希望线程立即开始执行的时候。

  当所有的线程都分配完成之后,通过调用每个线程的start()方法再让他们开始。相比于thread模块的管理一组锁(分配、获取、释放检查锁状态)来说,threading模块的Thread类只需要为每个线程调用join()方法即可。join(timeout=None)方法将等待线程结束,或者是达到指定的timeout时间时。这种锁又称为自旋锁。

  最重要的是:join()方法,其实你根本不需要调用它。一旦线程启动,就会一直执行,直到给定的函数完成后退出。如果主线程还有其他事情要做(并不需要等待这些线程完成),可以不调用join()。join()只有在你需要等待线程完成时候才是有用的。

例如上面的脚本中,我们注释掉join()代码:

……
for i in nloops:
threads[i].start() #循环 开始线程
'''
for i in nloops:
threads[i].join() #循环 join()方法可以让主线程等待所有的线程都执行完毕。
'''
print('任务完成于:',ctime()) if __name__=='__main__':
main()

运行结果:

PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepC.py
程序开始于: Thu Mar 29 21:55:10 2018
开始循环 0 at: Thu Mar 29 21:55:10 2018
开始循环 1 at: Thu Mar 29 21:55:10 2018
任务完成于: Thu Mar 29 21:55:10 2018
循环 1 结束于: Thu Mar 29 21:55:12 2018
循环 0 结束于: Thu Mar 29 21:55:14 2018

我们发现:主线程的任务比两个循环线程要先执行(任务完成于……在 循环X结束……的前面)

第二种方法:创建Thread类的实例,传递一个可调用的类实例

创建线程时,于传入函数类似的方法是传入一个可调用的类的实例,用于线程执行——这种方法更加接近面向对象的多线程编程。比起一个函数或者从一个函数组中选择而言,这种可调用的类包含一个执行环境,有更好的灵活性。

在上述的mtsleepC.py脚本中添加一个新类ThreadFunc,稍微改动一番,形成mtsleepD.py文件:

#!/usr/bin/env python

import threading
from time import sleep,ctime loops=[4,2] class ThreadFunc(object):
def __init__(self,func,args,name=''):
self.name=name
self.func = func
self.args=args def __call__(self):
self.func(*self.args) def loop(nloop,nsec):
print('开始循环',nloop,'在:',ctime())
sleep(nsec)
print('结束循环',nloop,'于:',ctime()) def main():
print('程序开始于:',ctime())
threads = []
nloops = range(len(loops)) for i in nloops:
t = threading.Thread(target=ThreadFunc(loop,(i,loops[i]),loop.__name__)) #传递一个可调用类的实例
threads.append(t) for i in nloops:
threads[i].start() #开始所有的线程 for i in nloops:
threads[i].join() #等待所有的线程执行完毕 print('任务完成于:',ctime()) if __name__=='__main__':
main()

执行结果:

PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepD.py
程序开始于: Thu Mar 29 22:30:02 2018
开始循环 0 在: Thu Mar 29 22:30:02 2018
开始循环 1 在: Thu Mar 29 22:30:02 2018
结束循环 1 于: Thu Mar 29 22:30:04 2018
结束循环 0 于: Thu Mar 29 22:30:06 2018
任务完成于: Thu Mar 29 22:30:06 2018

上述脚本中,主要添加了ThreadFunc类,并在实例化Thread对象时,通过传参的形式同时实例化了可调用类ThreadFunc。这里同时完成了两个实例化。

我们研究一下创建ThreadFunc类的思想:我们希望这个类更加通用,而不是局限于loop()函数,为此,添加了一些新的东西,比如这个类保存了函数自身、函数的参数、以及函数名。构造函数__init__()用于设定上述值。当创建新线程的时候,Thread类的代码将调用ThreadFunc对象,此时会调用__call__()这个特殊方法。

(老实说,这种方法显得有些尴尬,并且稍微难以阅读)

第三种方法:派生Thread的子类,并创建子类的实例

和方法二相比,方法三再创建线程时使用子类要相对更容易阅读,下面是mtsleepE.py脚本:

#!/usr/bin/env pyhton

import threading
from time import sleep,ctime loops=[4,2] class MyThread(threading.Thread):
def __init__(self,func,args,name=''):
threading.Thread.__init__(self)
self.name = name
self.func = func
self.args = args def run(self):
self.func(*self.args) def loop(nloop,nsec):
print('开始循环',nloop,'在:',ctime())
sleep(nsec)
print('结束循环',nloop,'于:',ctime()) def main():
print('程序开始于:',ctime())
threads = []
nloops = range(len(loops)) for i in nloops:
t = MyThread(loop,(i,loops[i]),loop.__name__)
threads.append(t) for i in nloops:
threads[i].start() for i in nloops:
threads[i].join() print('所有的任务完成于:',ctime()) if __name__ =='__main__':
main()

运行结果:

PS C:\Users\WC> python E:\Python3.6.3\workspace\mtsleepE.py
程序开始于: Thu Mar 29 22:52:18 2018
开始循环 0 在: Thu Mar 29 22:52:18 2018
开始循环 1 在: Thu Mar 29 22:52:18 2018
结束循环 1 于: Thu Mar 29 22:52:20 2018
结束循环 0 于: Thu Mar 29 22:52:22 2018
所有的任务完成于: Thu Mar 29 22:52:22 2018

比较方法二和方法三,重要的变化在于:MyThread子类的构造函数必须先调用其父类的构造函数;重写run()方法,代替方法二中的__call__()方法。

优化第三种方法:

对MyThread类进行修改,增加一些调试信息的输出,并将该类单独存储为myThread.py的模块(MyThread.py),以便在以后的例子中需要的时候导入这个类。另外,除了简单的调用函数外,还可以将结果保存在实例的属性self.res中,同时增加新的方法getResult()来获取这个值:

#!/usr/bin/env python

import threading
from time import ctime class MyThread(threading.Thread):
def __init__(self,func,args,name=''):
threading.Thread.__init__(self)
self.func = func
self.name = name
self.args = args def run(self):
print('开始执行',self.name,' 在:',ctime())
self.res = self.func(*self.args)
print(self.name,'结束于:',ctime()) def getResult(self):
return self.res

下面,我们介绍多线程和单线程执行效果对比的时候,会用到这个MyThread.py模块。

脚本mtfacfib.pt,比较了递归求斐波那契、阶乘和累计函数的执行,分别按照单线程和多线程的方式执行同样的任务:

#!/usr/bin/env python

from myThread import MyThread
from time import ctime,sleep
#斐波那契
def fib(x):
sleep(0.005)
if x < 2:
return 1
return fib(x-1)+fib(x-2)
#阶乘
def fac(x):
sleep(0.1)
if x < 2:
return 1
return x*fac(x-1)
#累加
def sum(x):
sleep(0.1)
if x < 2 :
return 1
return x + sum(x-1) funcs=[fib,fac,sum]
n = 12 def main():
nfuncs = range(len(funcs)) #单线程
print('单线程模式')
for i in nfuncs:
print('开始',funcs[i].__name__,' 在:',ctime())
print(funcs[i](n))
print(funcs[i].__name__,'结束于:',ctime()) #多线程
print('多线程模式')
threads = []
for i in nfuncs :
t = MyThread(funcs[i],(n,),funcs[i].__name__)
threads.append(t) for i in nfuncs:
threads[i].start() for i in nfuncs:
threads[i].join()
print(threads[i].getResult()) print('所有的任务结束') if __name__ == '__main__':
main()

运行结果:

PS C:\Users\WC> python E:\Python3.6.3\workspace\mtfacfib.py
单线程模式
开始 fib 在: Fri Mar 30 14:08:43 2018
233
fib 结束于: Fri Mar 30 14:08:45 2018
开始 fac 在: Fri Mar 30 14:08:45 2018
479001600
fac 结束于: Fri Mar 30 14:08:46 2018
开始 sum 在: Fri Mar 30 14:08:46 2018
78
sum 结束于: Fri Mar 30 14:08:48 2018
多线程模式
开始执行 fib 在: Fri Mar 30 14:08:48 2018
开始执行 fac 在: Fri Mar 30 14:08:48 2018
开始执行 sum 在: Fri Mar 30 14:08:48 2018
fac 结束于: Fri Mar 30 14:08:49 2018
sum 结束于: Fri Mar 30 14:08:49 2018
fib 结束于: Fri Mar 30 14:08:50 2018
233
479001600
78
所有的任务结束

程序中,为了看到多线程如何改善性能的,我们加入了sleep函数用于减慢执行速度。

看到单线程模式中,只是简单的一次调用每个函数,并在函数结束执行的时候立即显示相关的结果;而使用多线程的时候,并不会立刻显示结果,因为我们希望MyThread类越通用越好(有输出和无输出都能执行),我们一直等到所有线程都join之后,再调用getResult()方法显示每个函数的返回值。

python 多线程编程之threading模块(Thread类)创建线程的三种方法的更多相关文章

  1. 《Java多线程面试题》系列-创建线程的三种方法及其区别

    1. 创建线程的三种方法及其区别 1.1 继承Thread类 首先,定义Thread类的子类并重写run()方法: package com.zwwhnly.springbootaction.javab ...

  2. python 多线程编程之_thread模块

    参考书籍:python核心编程 _thread模块除了可以派生线程外,还提供了基本的同步数据结构,又称为锁对象(lock object,也叫原语锁.简单锁.互斥锁.互斥和二进制信号量). 下面是常用的 ...

  3. java 创建线程的三种方法Callable,Runnable,Thread比较及用法

    转自:http://www.chinaitlab.com/Java/line/942440.html 编写多线程程序是为了实现多任务的并发执行,从而能够更好地与用户交互.一般有三种方法,Thread, ...

  4. Java多线程之创建线程的三种方式比较

    转载请注明原文地址:http://www.cnblogs.com/ygj0930/p/6560057.html  一:继承Thread类创建线程 1:继承Thread类定义线程子类: 2:重写run( ...

  5. python并发编程之threading线程(一)

    进程是系统进行资源分配最小单元,线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.进程在执行过程中拥有独立的内存单元,而多个线程共享内存等资源. 系列文章 py ...

  6. Android(java)学习笔记62:继承Thread类创建线程类

    package cn.itcast_02; /* * 该类要重写run()方法,为什么呢? * 不是类中的所有代码都需要被线程执行的. * 而这个时候,为了区分哪些代码能够被线程执行,java提供了T ...

  7. 用Thread类创建线程-2

    支持原创,本系列文章均转自:http://www.blogjava.net/nokiaguy/category/38172.html 在Java中创建线程有两种方法:使用Thread类和使用Runna ...

  8. 用Thread类创建线程

    在Java中创建线程有两种方法:使用Thread类和使用Runnable接口.在使用Runnable接口时需要建立一个Thread实例.因此,无论是通过Thread类还是Runnable接口建立线程, ...

  9. Android(java)学习笔记2:继承Thread类创建线程类

    1. 继承Thread类 创建线程类: package cn.itcast_02; /* * 该类要重写run()方法,为什么呢? * 不是类中的所有代码都需要被线程执行的. * 而这个时候,为了区分 ...

随机推荐

  1. springboot+logback日志输出企业实践(上)

    目录 1.引言 2.logback简介 3. springboot默认日志框架-logback 3.1 springboot示例工程搭建 3.2 日志输出与基本配置 3.2.1 日志默认输出 3.2. ...

  2. Ajax与Http协议

    目录 Ajax与Http协议详解 Xhr对象 xhr对象发送请求整体感知 xhr对象的常用属性和方法 xhr对象发送post请求 xhr对象的兼容性问题 请求超时timeout与监听超时ontimeo ...

  3. day 23 复习

    本来应该学习day23,由于上午未学习,下去困,导致今天未进行进度 那就做一下简单的复习吧! 1. while else结构,如果while 后的条件条件不再满足 引发循环再继续,则执行else中的内 ...

  4. scrapy结合selenium抓取武汉市环保局空气质量日报

    1.前言 目标网站:武汉市环境保护局(http://hbj.wuhan.gov.cn/viewAirDarlyForestWaterInfo.jspx).scrapy对接selenium模块抓取空气质 ...

  5. day20190915write from memory

    jQuery_Chapter02_20190912/ jQuery操作类样式.html <!DOCTYPE html> <html> <head> <meta ...

  6. centos6.7下安装glibc-2.17

    glibc  所有版本下载地址 : http://ftp.gnu.org/pub/gnu/glibc/ 安装先决条件: #yum install gcc libffi-devel python-dev ...

  7. 混淆矩阵-MATLAB代码详解

    一.混淆矩阵 (一).简介 在人工智能中,混淆矩阵(confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵.在图像精度评价中,主要用于比较分类结果和实际测得值, ...

  8. 解决Connection to Xxx@localhost failed.

    解决: Connection to jianshu@localhost failed. [08001] Could not create connection to database server. ...

  9. [Abp vNext 源码分析] - 13. 本地事件总线与分布式事件总线 (Rabbit MQ)

    一.简要介绍 ABP vNext 封装了两种事件总线结构,第一种是 ABP vNext 自己实现的本地事件总线,这种事件总线无法跨项目发布和订阅.第二种则是分布式事件总线,ABP vNext 自己封装 ...

  10. JQuery之选择集过滤

    JQuery选择集过滤应用如下: 代码实现: <script src="JS/jquery-3.4.1.js"></script> <script&g ...