python中进程池的应用
#原创,转载请联系
假设我们写的一个程序需要运行100个子进程的时候,那么写程序时,不可能循环创建销毁100个进程吧?进程的创建与销毁是很耗系统的资源的。
进程池的作用就体现出来了。
进程池可以控制进程的数量,重复利用进程对象,减少创建和销毁进程的开销。
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
1.创建进程池
pool = multiprocessing.Pool()
创建进程池可以接收一个参数,这个参数可以设置进程池的最大值。就是指定有几个子进程在“同时”进行。(为什么说是“同时”,因为在并发的情况下,子进程和主进程是按照时间片轮寻的方式执行的,只是切换得过快,并不是真的一起运行。)
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
2.进程池的应用
import multiprocessing
import os
import random
import time def run_time(index):
start_time = time.time()
time.sleep(random.random())
print("任务%d 任务id为%d 任务运行的时间为%0.2f" % (index,os.getpid(),
time.time()-start_time)) if __name__ == '__main__':
pool = multiprocessing.Pool(3)
for i in range(10):
pool.apply_async(func=run_time,args=(i,))
pool.close()
pool.join()
print("结束标志") 输出:
任务2 任务id为3191 任务运行的时间为0.29
任务1 任务id为3190 任务运行的时间为0.33
任务0 任务id为3189 任务运行的时间为0.45
任务3 任务id为3191 任务运行的时间为0.41
任务4 任务id为3190 任务运行的时间为0.39
任务5 任务id为3189 任务运行的时间为0.76
任务7 任务id为3190 任务运行的时间为0.52
任务6 任务id为3191 任务运行的时间为0.80
任务8 任务id为3189 任务运行的时间为0.56
任务9 任务id为3190 任务运行的时间为0.80
结束标志
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
3.进程池的进程默认都是守护进程
进程池的子进程都是由主进程创建的,且默认都是守护进程。所以当主进程执行完之后,进程池的子进程全部都被中断。如果需要执行完进程池的子进程,才结束程序,需要加上两句代码。
pool.close() # 必须先关闭进程池,不再让它接收新的进程,才能进行下一步的阻塞。(已经在排队的进程不算新进程了!例如上面的例子,
10个子进程已经在进程池排队,所以join方法会阻塞直到10个子进程执行完成。)
pool.join()
上面的例子,如果没有这两句代码,输出会变成下面的结果
import multiprocessing
import os
import random
import time def run_time(index):
start_time = time.time()
time.sleep(random.random())
print("任务%d 任务id为%d 任务运行的时间为%0.2f" % (index,os.getpid(),
time.time()-start_time)) if __name__ == '__main__':
pool = multiprocessing.Pool(3)
for i in range(10):
pool.apply_async(func=run_time,args=(i,))
print("结束标志") 输出:
结束标志
进程池排队的10个进程,都是守护进程。还没来得及运行,主进程运行了,然后中断了进程池所有的子进程,因次子进程并没有输出。
-----------------------------------------------------------------------------------------我是一条分割线----------------------------------------------------------------------------------------------------
4.进程池中子进程之间的通信。
关于进程间的通信,可以看我的另一篇博客。https://www.cnblogs.com/chichung/p/9533227.html
那么,进程池中的子进程之间怎么进行通信呢?
我们来在进程池创建两个子进程,然后让一个子进程把数据放在队列,另外一个子进程在队列里取数据。
import multiprocessing
import time def send_data(queue):
for i in "python":
queue.put(i)
print("把%s放进队列里" % i) def recv_data(queue):
while not queue.empty():
data = queue.get()
print("在队列里取得%s" % data) if __name__ == '__main__':
q = multiprocessing.Manager().Queue(5) # 进程池之间的通信中间要加Manager(),单纯进程间的通信并不用,这是最大的区别。
pool = multiprocessing.Pool(2)
pool.apply_async(func=send_data,args=(q,))
time.sleep(1)
pool.apply_async(func=recv_data,args=(q,))
time.sleep(1)
pool.close()
pool.join()
print("结束标志") 输出:
把p放进队列里
把y放进队列里
把t放进队列里
把h放进队列里
把o放进队列里
在队列里取得p
把n放进队列里
在队列里取得y
在队列里取得t
在队列里取得h
在队列里取得o
在队列里取得n
结束标志
进程池里面子进程的通信也是用到Queue队列,但是创建的方式稍微有点不同,上面代码注释那里已经提出。
python中进程池的应用的更多相关文章
- python中进程池和回调函数
一.数据共享 1.进程间的通信应该尽量避免共享数据的方式 2.进程间的数据是独立的,可以借助队列或管道实现通信,二者都是基于消息传递的. 虽然进程间数据独立,但可以用过Manager实现数据共享,事实 ...
- Python多进程库multiprocessing中进程池Pool类的使用[转]
from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...
- Python多进程库multiprocessing中进程池Pool类的使用
问题起因 最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似ba ...
- Python中进程
程序 程序:编写完的代码称为程序. 进程 进程:又称重量级进程,正在执行中的程序称为进程.进程的执行会占用内存等资源.多个进程同时执行时,每个进程的执行都需要由操作系统按一定的算法(RR调度.优先数调 ...
- day 27 Python中进程的操作
进程的创建和结束: multiprocess模块: multiprocess不是一个模块而是python中一个操作.管理进程的包 分为四个部分:创建进程部分,进程同步部分,进程池部分,进程之间数据共享 ...
- python 36 进程池、线程池
目录 1. 死锁与递归锁 2. 信号量Semaphor 3. GIL全局解释器锁:(Cpython) 4. IO.计算密集型对比 4.1 计算密集型: 4.2 IO密集型 5. GIL与Lock锁的区 ...
- python中进程、线程、协程简述
进程 python中使用multiprocessing模块对进程进行操作管理 进程同步(锁.信号量.事件) 锁 —— multiprocessing.Lock 只要用到了锁 锁之间的代码就会变成同步的 ...
- python中进程详解
1:pdb调试:基于命令行的调试工具,非常类似gnu和gdb调试,以下是常用的调试命令: 可以python -m pdb xxx.py(你的py文件名)进入命令行调试模式 命令 简写命令 作用 bea ...
- Python 多进程进程池Queue进程通信
from multiprocessing import Pool,Manager import time def hanshu(queue,a): n = 1 while n<50: # pri ...
随机推荐
- C#非托管跨线程委托调试
使用C#调用mingw的so文件,拿视频数据回wpf的界面进行显示,注册了回调函数.C++在调用回调函数时遇到了委托被回收的问题,提示:“类型的已垃圾回收委托进行了回调.这可能会导致应用程序崩溃.损坏 ...
- BZOJ 2946 POI2000 公共串 后缀自动机(多串最长公共子串)
题意概述:给出N个字符串,每个串的长度<=2000(雾...可能是当年的年代太久远机子太差了),问这N个字符串的最长公共子串长度为多少.(N<=5) 抛开数据结构,先想想朴素做法. 设计一 ...
- UVA 11297 Census(二维线段树)
Description This year, there have been many problems with population calculations, since in some cit ...
- Android插件化框架
1. dynamic-load-apk/DL动态加载框架 是基于代理的方式实现插件框架,对 App 的表层做了处理,通过在 Manifest 中注册代理组件,当启动插件组件时,首先启动一个代理组件 ...
- Hadoop世界中的HelloWorld之WordCount具体分析
MapReduce 应用举例:单词计数 WorldCount可以说是MapReduce中的helloworld了,下面来看看hadoop中的例子worldcount对其进行的处理过程,也能对mapre ...
- Android Studio的初体验
在机缘巧合之下遇到了安卓开发,接触了Android Studio开始了漫长的改bug的道路,以下为简易版心酸历程 首先我需要成功安装Android Studio,由于我过于叛逆以及为了避免出错于是从一 ...
- JavaScript中的String对象详解
1.属性 String对象最常用的属性是length,用于返回字符串对象的长度. 2.方法 CharAt(index) 返回字符串对象中指定索引号组成的字符串,位置的有效值为0到字符串的长度减1. ...
- [BinaryTree] 二叉搜索树(二叉查找树、二叉排序树)
二叉查找树(BinarySearch Tree,也叫二叉搜索树,或称二叉排序树BinarySort Tree)或者是一棵空树,或者是具有下列性质的二叉树: (1)若它的左子树不为空,则左子树上所有结点 ...
- 【bzoj2006】[NOI2010]超级钢琴 倍增RMQ+STL-堆
题目描述 小Z是一个小有名气的钢琴家,最近C博士送给了小Z一架超级钢琴,小Z希望能够用这架钢琴创作出世界上最美妙的音乐. 这架超级钢琴可以弹奏出n个音符,编号为1至n.第i个音符的美妙度为Ai,其中A ...
- 【bzoj3931】[CQOI2015]网络吞吐量 最短路+最大流
题目描述 路由是指通过计算机网络把信息从源地址传输到目的地址的活动,也是计算机网络设计中的重点和难点.网络中实现路由转发的硬件设备称为路由器.为了使数据包最快的到达目的地,路由器需要选择最优的路径转发 ...