Python并发实践_01_线程与进程初探
进程与线程
在多任务处理中,每一个任务都有自己的进程,一个任务会有很多子任务,这些在进程中开启线程来执行这些子任务。一般来说,可以将独立调度、分配的基本单元作为线程运行,而进程是资源拥有的基本单位。
python支持多进程multiprocessing,以及多线程threading。
多进程
os.fork()函数可以开启一个进程。该函数会返回两次值,分别在父进程中返回子进程的ID,而在子进程中永远返回0。
os.getpid()函数可以返回进程的ID。os.getppid()则可以返回父进程的ID。
通过os.fork(),可以随时开启一个进程并且返回进程ID,以及使用os.getpid()、os.getppid()函数,可以任意时刻查看目前所在的进程ID,以及父进程的ID。
fork()函数只在unix/linux下有效,windows并不支持fork(),使用multiprocessing.Process类提供的多进程调用更加完整地反映整个过程。
from multiprocessing imort Process
def proc_worker(args):
pass
def main():
p = Process(target=proc_worker,args=(some_args,))
p.start()
p.join()
Process实例指定子进程运行的函数以及相关参数,并且start()和join()方法可以控制进程的开始和等待。
需要注意的是,由于一个进程在同一时间只进行一个任务,所以子进程调用完之后,必须调用join()方法,使其父进程等待,否则进程将会成为僵尸进程。而对于线程来说,并不是必要join()。
进程之间也可以共享内存,但是在设计上,进程应该是资源拥有的基本单位,所以应该尽量避免进程之间共享内存,由于同步的需求,这样会降低程序的效率。
通过锁(Lock)来实现进程之间的同步:Lock实例有两个主要的方法:acquire()、released(),一把锁只能被一个进程占用。
进程之间可以通过Pipe和Queue通信,
其中Pipe实例时,默认是双向通道,管道的任何一端都可以收发消息,实例化时通过指定duplex=False即可创建单向通道,实例之后会得到包含两个元素的元组,代表管道的两端:
from multiprocessing import Pipe,Process
def proc1(pipe):
pipe.send('There is proc1')
print('proc1 recv:',pipe.recv())
def proc2(pipe):
pipe.send('There is proc2')
print('proc2 recv:',pipe.recv())
def main():
pipe = Pipe()
p1 = Process(target=proc1,args=(pipe[0],))
p2 = Process(target=proc2,args=(pipe[1],))
p1.start()
p2.start()
p1.join()
p2.join()
而Queue则是一个队列,满足先进先出原则(Pipe也是先进先出结构,如果发送多条信息,则会按照先进先出的顺序接收),并且Queue支持多个进程同时传入消息,并且支持多个进程同时读取消息,在实例化时,指定一个整数来限制最大允许的进程数:
from multiprocessing import Queue,Process
import os
def inQueue(queue):
info = 'put from proc:%s'%os.getpid()
queue.put(info)
def outQueue(queue):
info = queue.get()
print('%s get a info of %s'%(os.getpid(),info))
def main():
queue = Queue(5)
processes1 = []
processes2 = []
for i in range(10):
process = Process(target = inQueue,args=(queue,))
process.start()
processes1.append(process)
for i in range(10):
process = Process(target = outQueue,args=(queue,))
process.start()
processes2.append(process)
for proc in processes1:
proc.join()
queue.close()
for proc in processes2:
proc.join()
虽然在Queue中遵循先进先出的原则,但是由于上述代码并没有做进程同步,如果要如实反应Queue中的情况,应该添加锁:
from multiprocessing import Process,Queue,Lock
import os
def inQueue(queue,lock):
lock.acquire()
info = 'put from proc:%s'%os.getpid()
print '%s put a info'%os.getpid()
queue.put(info)
lock.release()
def outQueue(queue,lock):
lock.acquire()
info = queue.get()
print('%s get a info of %s'%(os.getpid(),info))
lock.release()
def main1():
queue = Queue(10)
lock = Lock()
processes1 = []
processes2 = []
for i in range(10):
process = Process(target = inQueue,args=(queue,lock))
process.start()
processes1.append(process)
for i in range(10):
process = Process(target = outQueue,args=(queue,lock))
process.start()
processes2.append(process)
for proc in processes1:
proc.join()
queue.close()
for proc in processes2:
proc.join()
多线程
多线程即一个进程中执行的任务的多个子任务,从设计上应该是独立调度和分配的基本单元。Python中多线程使用threading模块实现。
threading和multiprocessing类似,具有一个Thread类,用来实例化线程对象,Thread实例和Process一样也具有start(),join()等方法。
前面提到进程中最好不要有资源的交换,所以锁模型在进程中比较少用到,而在线程中就比较普遍,线程与锁模型是基本的并发模型,线程中的Lock和进程中一样,也具有acquire()方法和release()方法。
然而,在python中,多线程并发并不能完美地执行,这是因为Python的官方解释器CPython在设计时,添加了GIL锁,任何Python线程执行之前都必须获得GIL锁,每执行100条字节码GIL锁会得到释放,所以Python中的多线程仍然是交替进行的,Python中多线程只能用到同一个CPU,如果要使用多个CPU,需要用到多进程来完成。
但是这并不表示python中的多线程没有意义,虽然不能运用多核硬件,但是同一个任务多线程执行会比开多个进程效率要高很多。
Python并发实践_01_线程与进程初探的更多相关文章
- 《转载》Python并发编程之线程池/进程池--concurrent.futures模块
本文转载自Python并发编程之线程池/进程池--concurrent.futures模块 一.关于concurrent.futures模块 Python标准库为我们提供了threading和mult ...
- Python并发编程之线程池&进程池
引用 Python标准库为我们提供了threading和multiprocessing模块编写相应的多线程/多进程代码,但是当项目达到一定的规模,频繁创建/销毁进程或者线程是非常消耗资源的,这个时候我 ...
- Python并发编程之线程池/进程池--concurrent.futures模块
一.关于concurrent.futures模块 Python标准库为我们提供了threading和multiprocessing模块编写相应的多线程/多进程代码,但是当项目达到一定的规模,频繁创建/ ...
- python网络编程基础(线程与进程、并行与并发、同步与异步、阻塞与非阻塞、CPU密集型与IO密集型)
python网络编程基础(线程与进程.并行与并发.同步与异步.阻塞与非阻塞.CPU密集型与IO密集型) 目录 线程与进程 并行与并发 同步与异步 阻塞与非阻塞 CPU密集型与IO密集型 线程与进程 进 ...
- python并发编程之线程/协程
python并发编程之线程/协程 part 4: 异步阻塞例子与生产者消费者模型 同步阻塞 调用函数必须等待结果\cpu没工作input sleep recv accept connect get 同 ...
- Python并发编程03 /僵孤进程,孤儿进程、进程互斥锁,进程队列、进程之间的通信
Python并发编程03 /僵孤进程,孤儿进程.进程互斥锁,进程队列.进程之间的通信 目录 Python并发编程03 /僵孤进程,孤儿进程.进程互斥锁,进程队列.进程之间的通信 1. 僵尸进程/孤儿进 ...
- python并发编程02 /多进程、进程的创建、进程PID、join方法、进程对象属性、守护进程
python并发编程02 /多进程.进程的创建.进程PID.join方法.进程对象属性.守护进程 目录 python并发编程02 /多进程.进程的创建.进程PID.join方法.进程对象属性.守护进程 ...
- Python网络编程之线程,进程
一. 线程: 基本使用 线程锁 线程池 队列(生产者消费者模型) 二. 进程: 基本使用 进程锁 进程池 进程数据共享 三. 协程: gevent greenlet 四. 缓存: memcache ...
- python学习笔记12 ----线程、进程
进程和线程的概念 进程和线程是操作系统中两个很重要的概念,对于一般的程序,可能有若干个进程,每一个进程有若干个同时执行的线程.进程是资源管理的最小单位,线程是程序执行的最小单位(线程可共享同一进程里的 ...
随机推荐
- postgres 9.5 FDW变化
9.5主要是2个方法有变动: create_foreignscan_path extern ForeignPath *create_foreignscan_path(PlannerInfo *root ...
- eclipse设置author等注释
windows--> preference--> PyDev --> Editor --> Templates 点击New,新建一个template,输入name(之后选择这个 ...
- 【Struts2的执行流程,这个博主写的很详细】
http://blog.csdn.net/wjw0130/article/details/46371847
- MySQL系列:基于binlog的增量订阅与消费(一)
在一些业务场景中,像在数据分析中我们有时候需要捕获数据变化(CDC):在数据审计中,我们也往往需要知道数据从这个点到另一个点的变化:同样在实时分析中,我们有时候需要看到某个值得实时变化等. 要解决以上 ...
- HDU 3569 Imaginary Date 简单期望
推一下公式.就会发现是这个.. 由于设结果有x种方案.则每一个数字出现的概率都均等,然后和就是x*m 每种方案的概率是1/x 每一个数出现的概率都是1/n 所以每一个方案的和就是 sum/n *m # ...
- Git 经常使用命令总结
一 关于加入.删除和回退 1 git rm --cached file 想要git不再跟踪这个文件,可是又不想在硬盘中删除该文件 2 在被git管理的文件夹中删除文件时,能够选择例如以下两种方式: ...
- (四)—性能测试工具curl-loader(linux)
curl-loader介绍 curl-loader(也被称为"omes-NIK"和"davilka")是一个开源的C语言编写的工具,模拟应用负载和成千上万的几十 ...
- JAVA入门[2]-安装Maven
一.资料 1.官网: https://maven.apache.org/ 二.下载Maven 下载地址:https://maven.apache.org/download.cgi# 三.Windows ...
- 转:java泛型总结
转自:http://www.cnblogs.com/lwbqqyumidi/p/3837629.html 一. 泛型概念的提出(为什么需要泛型)? 首先,我们看下下面这段简短的代码: 1 public ...
- IntelliJ IDEA 环境常用设置整理
1.修改为Eclipse快捷键 File -> Settings -> Keymap => Keymaps改为 Eclipse copy 2.显示行号: File -> S ...