python中进程池的应用
#原创,转载请联系
假设我们写的一个程序需要运行100个子进程的时候,那么写程序时,不可能循环创建销毁100个进程吧?进程的创建与销毁是很耗系统的资源的。
进程池的作用就体现出来了。
进程池可以控制进程的数量,重复利用进程对象,减少创建和销毁进程的开销。
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
1.创建进程池
pool = multiprocessing.Pool()
创建进程池可以接收一个参数,这个参数可以设置进程池的最大值。就是指定有几个子进程在“同时”进行。(为什么说是“同时”,因为在并发的情况下,子进程和主进程是按照时间片轮寻的方式执行的,只是切换得过快,并不是真的一起运行。)
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
2.进程池的应用
import multiprocessing
import os
import random
import time def run_time(index):
start_time = time.time()
time.sleep(random.random())
print("任务%d 任务id为%d 任务运行的时间为%0.2f" % (index,os.getpid(),
time.time()-start_time)) if __name__ == '__main__':
pool = multiprocessing.Pool(3)
for i in range(10):
pool.apply_async(func=run_time,args=(i,))
pool.close()
pool.join()
print("结束标志") 输出:
任务2 任务id为3191 任务运行的时间为0.29
任务1 任务id为3190 任务运行的时间为0.33
任务0 任务id为3189 任务运行的时间为0.45
任务3 任务id为3191 任务运行的时间为0.41
任务4 任务id为3190 任务运行的时间为0.39
任务5 任务id为3189 任务运行的时间为0.76
任务7 任务id为3190 任务运行的时间为0.52
任务6 任务id为3191 任务运行的时间为0.80
任务8 任务id为3189 任务运行的时间为0.56
任务9 任务id为3190 任务运行的时间为0.80
结束标志
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
3.进程池的进程默认都是守护进程
进程池的子进程都是由主进程创建的,且默认都是守护进程。所以当主进程执行完之后,进程池的子进程全部都被中断。如果需要执行完进程池的子进程,才结束程序,需要加上两句代码。
pool.close() # 必须先关闭进程池,不再让它接收新的进程,才能进行下一步的阻塞。(已经在排队的进程不算新进程了!例如上面的例子,
10个子进程已经在进程池排队,所以join方法会阻塞直到10个子进程执行完成。)
pool.join()
上面的例子,如果没有这两句代码,输出会变成下面的结果
import multiprocessing
import os
import random
import time def run_time(index):
start_time = time.time()
time.sleep(random.random())
print("任务%d 任务id为%d 任务运行的时间为%0.2f" % (index,os.getpid(),
time.time()-start_time)) if __name__ == '__main__':
pool = multiprocessing.Pool(3)
for i in range(10):
pool.apply_async(func=run_time,args=(i,))
print("结束标志") 输出:
结束标志
进程池排队的10个进程,都是守护进程。还没来得及运行,主进程运行了,然后中断了进程池所有的子进程,因次子进程并没有输出。
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
4.进程池中子进程之间的通信。
关于进程间的通信,可以看我的另一篇博客。https://www.cnblogs.com/chichung/p/9533227.html
那么,进程池中的子进程之间怎么进行通信呢?
我们来在进程池创建两个子进程,然后让一个子进程把数据放在队列,另外一个子进程在队列里取数据。
import multiprocessing
import time def send_data(queue):
for i in "python":
queue.put(i)
print("把%s放进队列里" % i) def recv_data(queue):
while not queue.empty():
data = queue.get()
print("在队列里取得%s" % data) if __name__ == '__main__':
q = multiprocessing.Manager().Queue(5) # 进程池之间的通信中间要加Manager(),单纯进程间的通信并不用,这是最大的区别。
pool = multiprocessing.Pool(2)
pool.apply_async(func=send_data,args=(q,))
time.sleep(1)
pool.apply_async(func=recv_data,args=(q,))
time.sleep(1)
pool.close()
pool.join()
print("结束标志") 输出:
把p放进队列里
把y放进队列里
把t放进队列里
把h放进队列里
把o放进队列里
在队列里取得p
把n放进队列里
在队列里取得y
在队列里取得t
在队列里取得h
在队列里取得o
在队列里取得n
结束标志
进程池里面子进程的通信也是用到Queue队列,但是创建的方式稍微有点不同,上面代码注释那里已经提出。
python中进程池的应用的更多相关文章
- python中进程池和回调函数
一.数据共享 1.进程间的通信应该尽量避免共享数据的方式 2.进程间的数据是独立的,可以借助队列或管道实现通信,二者都是基于消息传递的. 虽然进程间数据独立,但可以用过Manager实现数据共享,事实 ...
- Python多进程库multiprocessing中进程池Pool类的使用[转]
from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...
- Python多进程库multiprocessing中进程池Pool类的使用
问题起因 最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似ba ...
- Python中进程
程序 程序:编写完的代码称为程序. 进程 进程:又称重量级进程,正在执行中的程序称为进程.进程的执行会占用内存等资源.多个进程同时执行时,每个进程的执行都需要由操作系统按一定的算法(RR调度.优先数调 ...
- day 27 Python中进程的操作
进程的创建和结束: multiprocess模块: multiprocess不是一个模块而是python中一个操作.管理进程的包 分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享 ...
- python 36 进程池、线程池
目录 1. 死锁与递归锁 2. 信号量Semaphor 3. GIL全局解释器锁:(Cpython) 4. IO.计算密集型对比 4.1 计算密集型: 4.2 IO密集型 5. GIL与Lock锁的区 ...
- python中进程、线程、协程简述
进程 python中使用multiprocessing模块对进程进行操作管理 进程同步(锁.信号量.事件) 锁 —— multiprocessing.Lock 只要用到了锁 锁之间的代码就会变成同步的 ...
- python中进程详解
1:pdb调试:基于命令行的调试工具,非常类似gnu和gdb调试,以下是常用的调试命令: 可以python -m pdb xxx.py(你的py文件名)进入命令行调试模式 命令 简写命令 作用 bea ...
- Python 多进程进程池Queue进程通信
from multiprocessing import Pool,Manager import time def hanshu(queue,a): n = 1 while n<50: # pri ...
随机推荐
- postman工具【接口自动化测试关于断言】
在使用postman工具进行接口自动化时我们经常需要断言来进行判断,结果到底是成功还是失败. 但在collection runner/Newman里如果不加断言,跑完后都无法知道是成功还是失败 断言是 ...
- 个人作业4——alpha阶段个人总结1
一.个人总结 在alpha 结束之后, 每位同学写一篇个人博客, 总结自己的alpha 过程: 总体来说,这次的alpha并不是很顺利,编程是基础,如果对语言不是很熟悉的话,一个团队是很难开发出什么东 ...
- 使用PHP静态变量当缓存的方法
下面这个PHP的代码实例,功能是帮助用户重置密码,requestResetPassword是接收用户重置密码的请求并且做了相应的检查.为了更好的复用性,我将重置密码的操作单独分配到一个新的resetP ...
- 纯Div+Css制作的漂亮点击按钮和关闭按钮
纯Div+Css制作的漂亮点击按钮和关闭按钮,单击点击按钮也有效果.这些都不是图片.
- Div+Css制作圆
Div+Css制作四分之一圆主要是使用Css3.0中的border-radius这个圆角隐藏属性.利用这一属性,我们可以画圆,画半圆,四分之三圆,四分之一圆等.以后我会更新…… 如何使用border- ...
- Git 删除服务器的远程分支
git push origin :分支名 可能会出现,在A机子操作,刷新下成功删除,但在B机子上还显示,再用下命令提示不存在该分支,只要再推送一个任意分支即可正常显示
- 修改innodb_flush_log_at_trx_commit参数提升insert性能
最近,在一个系统的慢查询日志里发现有个insert操作很慢,达到秒级,并且是比较简单的SQL语句,把语句拿出来到mysql中直接执行,速度却很快. 这种问题一般不是SQL语句本身的问题,而是在具体的应 ...
- ubuntu环境配置------增加右键菜单打开terminal
直接安装一个软件包nautilus-open-terminal 终端输入:sudo apt-get install nautilus-open-terminal 重启系统!
- Git菜鸟
1.git 和svn的差异 git和svn 最大的差异在于git是分布式的管理方式而svn是集中式的管理方式.如果不习惯用代码管理工具,可能比较难理解分布式管理和集中式管理的概念.下面介绍两种工具的工 ...
- EL遍历集合
jstl EL表达式遍历集合 博客分类: JSTL/EL JSTLEL遍历集合 在EL中,方括号运算符用来检索数组和集合的元素.对于实现 java.util.Map 接口的集合,方括号运算符使用关联 ...