python多进程的理解 multiprocessing Process join run

最近看了下多进程。

一种接近底层的实现方法是使用 os.fork()方法，fork出子进程。但是这样做事有局限性的。比如windows的os模块里面没有 fork() 方法。

windows：。linux：

另外还有一个模块：subprocess。这个没整过，但从vamei的博客里看到说也同样有局限性。

所以直接说主角吧 --- multiprocessing模块。 multiprocessing模块会在windows上时模拟出fork的效果，可以实现跨平台，所以大多数都使用multiprocessing。

下面给一段简单的代码，演示一下创建进程：

#encoding:utf-8

from multiprocessing import Process

import os, time, random

#线程启动后实际执行的代码块

def r1(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

def r2(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

if __name__ == "__main__":

        print "main process run..."

        p1 = Process(target=r1, args=('process_name1', ))       #target:指定进程执行的函数，args:该函数的参数，需要使用tuple

        p2 = Process(target=r2, args=('process_name2', ))

        p1.start()    #通过调用start方法启动进程，跟线程差不多。

        p2.start()    #但run方法在哪呢？待会说。。。

        p1.join()     #join方法也很有意思，寻思了一下午，终于理解了。待会演示。

        p2.join()

        print "main process runned all lines..."

执行结果：

上面提到了两个方法：run 和join

run：如果在创建Process对象的时候不指定target，那么就会默认执行Process的run方法：

#encoding:utf-8

from multiprocessing import Process

import os, time, random

def r():

    print 'run method'

if __name__ == "__main__":

        print "main process run..."

        #没有指定Process的targt

        p1 = Process()

        p2 = Process()

        #如果在创建Process时不指定target，那么执行时没有任何效果。因为默认的run方法是判断如果不指定target，那就什么都不做

        #所以这里手动改变了run方法

        p1.run = r

        p2.run = r

        p1.start()

        p2.start()

        p1.join()

        p2.join()

        print "main process runned all lines..."

另：python源码里，Process.run方法：

执行结果：

可见如果在实例化Process时不指定target，就会执行默认的run方法。

还有一个join方法：

最上面演示的代码中，在调用Process的start方法后，调用了两次join方法。这个join方法是干什么的呢？

官方文档的意思是：阻塞当前进程，直到调用join方法的那个进程执行完，再继续执行当前进程。

比如还是刚才的代码，只是把两个join注释掉了：

#encoding:utf-8

from multiprocessing import Process

import os, time, random

def r1(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

def r2(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

if __name__ == "__main__":

        print "main process run..."

        p1 = Process(target=r1, args=('process_name1', ))

        p2 = Process(target=r2, args=('process_name2', )) 

        p1.start()

        p2.start()

        #p1.join()
        #p2.join()

        print "main process runned all lines..."

执行结果：

发现主进程不像之前那样，等待两个子进程执行完了，才继续执行。而是启动两个进程后立即向下执行。

为了深刻理解，这次把p2的执行函数里面睡眠时间调大，让他多睡一会，然后保留p1的join，注释掉p2的join，效果更明显：

#encoding:utf-8

from multiprocessing import Process

import os, time, random

def r1(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random())

def r2(process_name):

    for i in range(5):

        print process_name, os.getpid()     #打印出当前进程的id

        time.sleep(random.random()*2)

if __name__ == "__main__":

        print "main process run..."

        p1 = Process(target=r1, args=('process_name1', ))

        p2 = Process(target=r2, args=('process_name2', )) 

        p1.start()

        p2.start()

        p1.join()

        #p2.join()

        print "main process runned all lines..."

执行结果：

发现主线程只是等待p1完成了，就会向下执行，而不会等待p2是否完成。

所以使用多进程的常规方法是，先依次调用start启动进程，再依次调用join要求主进程等待子进程的结束。

然而为什么要先依次调用start再调用join，而不是start完了就调用join呢，如下：

由：

p1.start()

p2.start()

p1.join()

改为：

p1.start()

p1.join()

p2.start()

执行效果：

发现是先执行完p1，再执行主线程，最后才开始p2。

今天上午一直困惑这个事，现在终于明白了。join是用来阻塞当前线程的，p1.start()之后，p1就提示主线程，需要等待p1结束才向下执行，那主线程就乖乖的等着啦，自然没有执行p2.start()这一句啦，当然就变成了图示的效果了。

python多进程的理解 multiprocessing Process join run的更多相关文章

进程 multiprocessing Process join Lock Queue
多道技术 1.空间上的复用多个程序公用一套计算机硬件 2.时间上的复用 cpu 切换程序+保存程序状态 1.当一个程序遇到IO操作,操作系统会剥夺该程序的cpu执行权限(提高了cpu的利用率,并且不 ...
Python多进程multiprocessing使用示例
mutilprocess简介像线程一样管理进程,这个是mutilprocess的核心,他与threading很是相像,对多核CPU的利用率会比threading好的多. import multipr ...
Python多进程库multiprocessing创建进程以及进程池Pool类的使用
问题起因最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似bag ...
创建一个多进程（multiprocessing.Process）
进程是资源的集合,每个进程至少包含一个线程 import multiprocessing #导入进程模块import time, threading #导入线程 def thread_run(): p ...
【转】Python多进程编程
[转]Python多进程编程序. multiprocessingpython中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在python中大部分情况需要使用多进程.Pytho ...
Python 多进程编程之multiprocessing--Process
Python 多进程编程之multiprocessing 1,Process 跨平台的进程创建模块(multiprocessing), 支持跨平台:windowx/linux 创建和启动创 ...
python多进程详解和协程
1.由于python多线程适合于多IO操作,但不适合于cpu计算型工作,这时候可以通过多进程实现.python多进程简单实用 # 多进程,可以cpu保持一致,python多线程适合多io.对于高cpu ...
python多进程总结
概述由于python中全局解释器锁(GIL)的存在,所以python多线程并不能有效利用CPU多核的性能(相当于单核并发)实现多线程多核并行,所以在对CPU密集型的程序时处理效率较低,反而对IO密集 ...
Python 多进程异常处理
前言最近项目用到了Python作为网站的前端,使用的框架是基于线程池的Cherrypy,但是前端依然有一些比较‘重’的模块.由于python的多线程无法很好的利用多核的性质,所以觉得把这些比较‘重’ ...

随机推荐

05_天气查询_JAX-WS方式_客户端
[客户端特点] 支持面向对象开发. 客户端功能调用webService,首先得知道WebService的地址. 一般情况下,只要知道了wsdl的地址,就可以知道WebService的地址. 我们上一篇 ...
01_根据Id查询User的数据
[工程目录] [数据库表中内容 user表] [sqlMapConfig.xml配置文件主要内容] 简述:sqlMapConfig.xml配置文件主要有两个作用: 1.配置和数据连接的相关信息,例如事 ...
LA 3516(ZOJ 2641) Exploring Pyramids（递推 DP）
Exploring Pyramids Archaeologists have discovered a new set of hidden caves in one of the Egyptian p ...
bzoj1901：Zju2112 Dynamic Rankings
思路:树套树,我写了两种,一种是线段树套splay,线段树维护区间信息,splay维护第k大,一种是树状数组套权值线段树(并不是什么可持久化线段树,只不过是动态开点罢了,为什么网上一大堆题解都是可持久 ...
bzoj1697：[Usaco2007 Feb]Cow Sorting牛排序 & bzoj1119：[POI2009]SLO
思路:以bzoj1119为例,题目已经给出了置换,而每一次交换的代价是交换二者的权值之和,而置换一定是会产生一些环的,这样就可以只用环内某一个元素去置换而使得其余所有元素均在正确的位置上,显然要选择环 ...
(hdu)5652 India and China Origins 二分+dfs
题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=5652 Problem Description A long time ago there ...
C++类继承内存布局（二）
转自:http://blog.csdn.net/jiangyi711/article/details/4890889# (二 )成员变量前面介绍完了类布局,接下来考虑不同的继承方式下,访问成员变量的 ...
clr介绍
CLR(公用语言运行时)和Java虚拟机一样也是一个运行时环境,它负责资源管理(内存分配和垃圾收集),并保证应用和底层操作系统之间必要的分离..NET提供了一个运行时环境,叫做公用语言运行时(Comm ...
rpc远程调用开发
RPC即远程过程调用,适用于集群管理,集群节点就是RPCServer,而我们发起远程调用的web服务器就是RPCClient.所以是少数rpcClient(可能一个)对多个RPCServer(集群节点 ...
ubuntu下php开发环境搭建,nginx+(cgi)php5fpm+memcached+xdebug
由于只是开发环境,所以都是选择比较简单的apt-get安装方式 ,但中间也遇到一点问题. 首先安装nginx nginx的安装和配置其实很简单,nginx本身非常轻量级, 直接 sudo apt-ge ...

python多进程的理解 multiprocessing Process join run

python多进程的理解 multiprocessing Process join run的更多相关文章

随机推荐

热门专题