python中进程池的应用
#原创,转载请联系
假设我们写的一个程序需要运行100个子进程的时候,那么写程序时,不可能循环创建销毁100个进程吧?进程的创建与销毁是很耗系统的资源的。
进程池的作用就体现出来了。
进程池可以控制进程的数量,重复利用进程对象,减少创建和销毁进程的开销。
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
1.创建进程池
pool = multiprocessing.Pool()
创建进程池可以接收一个参数,这个参数可以设置进程池的最大值。就是指定有几个子进程在“同时”进行。(为什么说是“同时”,因为在并发的情况下,子进程和主进程是按照时间片轮寻的方式执行的,只是切换得过快,并不是真的一起运行。)
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
2.进程池的应用
import multiprocessing
import os
import random
import time def run_time(index):
start_time = time.time()
time.sleep(random.random())
print("任务%d 任务id为%d 任务运行的时间为%0.2f" % (index,os.getpid(),
time.time()-start_time)) if __name__ == '__main__':
pool = multiprocessing.Pool(3)
for i in range(10):
pool.apply_async(func=run_time,args=(i,))
pool.close()
pool.join()
print("结束标志") 输出:
任务2 任务id为3191 任务运行的时间为0.29
任务1 任务id为3190 任务运行的时间为0.33
任务0 任务id为3189 任务运行的时间为0.45
任务3 任务id为3191 任务运行的时间为0.41
任务4 任务id为3190 任务运行的时间为0.39
任务5 任务id为3189 任务运行的时间为0.76
任务7 任务id为3190 任务运行的时间为0.52
任务6 任务id为3191 任务运行的时间为0.80
任务8 任务id为3189 任务运行的时间为0.56
任务9 任务id为3190 任务运行的时间为0.80
结束标志
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
3.进程池的进程默认都是守护进程
进程池的子进程都是由主进程创建的,且默认都是守护进程。所以当主进程执行完之后,进程池的子进程全部都被中断。如果需要执行完进程池的子进程,才结束程序,需要加上两句代码。
pool.close() # 必须先关闭进程池,不再让它接收新的进程,才能进行下一步的阻塞。(已经在排队的进程不算新进程了!例如上面的例子,
10个子进程已经在进程池排队,所以join方法会阻塞直到10个子进程执行完成。)
pool.join()
上面的例子,如果没有这两句代码,输出会变成下面的结果
import multiprocessing
import os
import random
import time def run_time(index):
start_time = time.time()
time.sleep(random.random())
print("任务%d 任务id为%d 任务运行的时间为%0.2f" % (index,os.getpid(),
time.time()-start_time)) if __name__ == '__main__':
pool = multiprocessing.Pool(3)
for i in range(10):
pool.apply_async(func=run_time,args=(i,))
print("结束标志") 输出:
结束标志
进程池排队的10个进程,都是守护进程。还没来得及运行,主进程运行了,然后中断了进程池所有的子进程,因次子进程并没有输出。
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
4.进程池中子进程之间的通信。
关于进程间的通信,可以看我的另一篇博客。https://www.cnblogs.com/chichung/p/9533227.html
那么,进程池中的子进程之间怎么进行通信呢?
我们来在进程池创建两个子进程,然后让一个子进程把数据放在队列,另外一个子进程在队列里取数据。
import multiprocessing
import time def send_data(queue):
for i in "python":
queue.put(i)
print("把%s放进队列里" % i) def recv_data(queue):
while not queue.empty():
data = queue.get()
print("在队列里取得%s" % data) if __name__ == '__main__':
q = multiprocessing.Manager().Queue(5) # 进程池之间的通信中间要加Manager(),单纯进程间的通信并不用,这是最大的区别。
pool = multiprocessing.Pool(2)
pool.apply_async(func=send_data,args=(q,))
time.sleep(1)
pool.apply_async(func=recv_data,args=(q,))
time.sleep(1)
pool.close()
pool.join()
print("结束标志") 输出:
把p放进队列里
把y放进队列里
把t放进队列里
把h放进队列里
把o放进队列里
在队列里取得p
把n放进队列里
在队列里取得y
在队列里取得t
在队列里取得h
在队列里取得o
在队列里取得n
结束标志
进程池里面子进程的通信也是用到Queue队列,但是创建的方式稍微有点不同,上面代码注释那里已经提出。
python中进程池的应用的更多相关文章
- python中进程池和回调函数
一.数据共享 1.进程间的通信应该尽量避免共享数据的方式 2.进程间的数据是独立的,可以借助队列或管道实现通信,二者都是基于消息传递的. 虽然进程间数据独立,但可以用过Manager实现数据共享,事实 ...
- Python多进程库multiprocessing中进程池Pool类的使用[转]
from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...
- Python多进程库multiprocessing中进程池Pool类的使用
问题起因 最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似ba ...
- Python中进程
程序 程序:编写完的代码称为程序. 进程 进程:又称重量级进程,正在执行中的程序称为进程.进程的执行会占用内存等资源.多个进程同时执行时,每个进程的执行都需要由操作系统按一定的算法(RR调度.优先数调 ...
- day 27 Python中进程的操作
进程的创建和结束: multiprocess模块: multiprocess不是一个模块而是python中一个操作.管理进程的包 分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享 ...
- python 36 进程池、线程池
目录 1. 死锁与递归锁 2. 信号量Semaphor 3. GIL全局解释器锁:(Cpython) 4. IO.计算密集型对比 4.1 计算密集型: 4.2 IO密集型 5. GIL与Lock锁的区 ...
- python中进程、线程、协程简述
进程 python中使用multiprocessing模块对进程进行操作管理 进程同步(锁.信号量.事件) 锁 —— multiprocessing.Lock 只要用到了锁 锁之间的代码就会变成同步的 ...
- python中进程详解
1:pdb调试:基于命令行的调试工具,非常类似gnu和gdb调试,以下是常用的调试命令: 可以python -m pdb xxx.py(你的py文件名)进入命令行调试模式 命令 简写命令 作用 bea ...
- Python 多进程进程池Queue进程通信
from multiprocessing import Pool,Manager import time def hanshu(queue,a): n = 1 while n<50: # pri ...
随机推荐
- redis安装与启动
安装简介: 在安装redis前需要了解redis官方发布时的版本规则,redis官方约定次版本号(即第一个小数点后的数字)为偶数的版本是稳定版(如2.8版,3.0版),奇数版本则为非稳定版本(如2.7 ...
- UVA 11297 Census(二维线段树)
Description This year, there have been many problems with population calculations, since in some cit ...
- 在线算法&离线算法
[在线算法] 定义:指用户每输入一个查询便马上处理一个查询.该算法一般用较长的时间做预处理,待信息充足以后便可以用较少的时间回答每个查询. 常见在线算法:ST算法 [离线算法] 定义:
- 创建带maven的javaWeb项目
1File——Maven——maven-archtypes-webapp GroupId:表示项目组织唯一标识符 ArtifacrId:表示项目唯一标识符 例如项目名称 Version是项目版本 这三 ...
- document.querySelector()和document.querySelectorAll()
HTML5向Web API新引入了 document.querySelector()和document.querySelectorAll()两个方法,都可以接收三种类型的参数:id(#),class( ...
- 【Linux】——搭建nexus
1.安装 前提条件: JDK已经安装,运行java -version查看. 将本地下载好的nexus存放到linux上,存放路径为 /usr/local/software.可使用winscp直接拷贝. ...
- 关于php网络爬虫phpspider
前几天,被老板拉去说要我去抓取大众点评某家店的数据,当然被我义正言辞的拒绝了,理由是我不会...但我的反抗并没有什么卵用,所以还是乖乖去查资料,因为我是从事php工作的,首先找的就是php的网络爬虫源 ...
- Bootstrap中的Affix插件
我们为什么要用bootstrap?因为懒!哦....不,是因为方便,呃...意思差不多. 今天来说说Affix这个插件,它可以使导航栏固定,免去了自己手写的麻烦,用着非常方便,废话不多说,下面是用法. ...
- NET中解决KafKa多线程发送多主题
NET中解决KafKa多线程发送多主题 一般在KafKa消费程序中消费可以设置多个主题,那在同一程序中需要向KafKa发送不同主题的消息,如异常需要发到异常主题,正常的发送到正常的主题,这时候就需要实 ...
- POJ——2449 Remmarguts' Date
Description "Good man never makes girls wait or breaks an appointment!" said the mandarin ...