python之multiprocessing创建进程

python的multiprocessing模块是用来创建多进程的，下面对multiprocessing总结一下使用记录。

multiprocessing创建多进程在windows和linux系统下的对比

fork()

import ospid = os.fork() # 创建一个子进程if pid == 0:    print('这是子进程')    print(os.getpid(),os.getppid())else:    print('这是父进程')    print(os.getpid())os.wait() # 等待子进程结束释放资源

fork函数被调用后会返回两次，pid为0的代表子进程，其他返回子进程的id号表示父进程。
getpid和getppid函数可以获取本进程和父进程的id号；

fork方式的缺点：

兼容性差，只能在类linux系统下使用，windows系统不可使用；
扩展性差，当需要多条进程的时候，进程管理变得很复杂；
会产生“孤儿”进程和“僵尸”进程，需要手动回收资源。

优点：

是系统自带的接近低层的创建方式，运行效率高。

Process创建进程

创建方式一：

from multiprocessing import Queue, Processimport osdef test():

    time.sleep(2)

    print('this is process {}'.format(os.getpid()))if __name__ == '__main__':

    p = Process(target=test)

    p.start() # 子进程 开始执行

    p.join() # 等待子进程结束

    print('ths peocess is ended')

创建方式二：

from multiprocessing import Queue, Processimport osclass MyProcess(Process):

    def run(self):

        time.sleep(2)

        print('this is process {}'.format(os.getpid()))    def __del__(self):

        print('del the process {}'.format(os.getpid()))if __name__ == '__main__':

    p = MyProcess()

    p.start()

    print('ths process is ended')# 结果：ths process is ended

this is process 7600del the process 7600del the process 12304

说明：

Process对象可以创建进程，但Process对象不是进程，其删除与否与系统资源是否被回收没有直接的关系。
上例看到del方法被调用了两次，Process进程创建时，子进程会将主进程的Process对象完全复制一份，这样在主进程和子进程各有一个Process对象，但是p1.start()启动的是子进程，主进程中的Process对象作为一个静态对象存在。
主进程执行完毕后会默认等待子进程结束后回收资源，不需要手动回收资源；
join()函数用来控制子进程结束的顺序,主进程会阻塞等待子进程结束，其内部也有一个清除僵尸进程的函数，可以回收资源；
当子进程执行完毕后，会产生一个僵尸进程，其会被join函数回收，或者再有一条进程开启，start函数也会回收僵尸进程，所以不一定需要写join函数。
windows系统在子进程结束后会立即自动清除子进程的Process对象，而linux系统子进程的Process对象如果没有join函数和start函数的话会在主进程结束后统一清除。

Process对象分析

class Process(object):

    def __init__(self, group=None, target=None, name=None, args=(), kwargs={}):

        pass

# Process对象是python用来创建进程的类

group：扩展保留字段；

target：目标代码，一般是我们需要创建进程执行的目标函数。

name：进程的名字，如果不指定会自动分配一个；

args：目标函数的普通参数；

kwargs：目标函数的键值对参数；

# 方法

start():创建一个子进程并执行，该方法一个Process实例只能执行一次，其会创建一个进程执行该类的run方法。

run():子进程需要执行的代码；

join()：主进程阻塞等待子进程直到子进程结束才继续执行，可以设置等待超时时间timeout.

terminate():使活着的进程终止；

is_alive():判断子进程是否还活着。

进程池Pool

如果需要创建大量的进程，就需要使用Pool了。

from multiprocessing import Queue, Process, Poolimport osdef test():

    time.sleep(2)

    print('this is process {}'.format(os.getpid()))def get_pool(n=5):

    p = Pool(n) # 设置进程池的大小

    for i in range(10):

        p.apply_async(test)

    p.close() # 关闭进程池

    p.join()if __name__ == '__main__':

    get_pool()

    print('ths process is ended')

分析：厦门厦工叉车怎么样？

如上，进程池Pool被创建出来后，即使实际需要创建的进程数远远大于进程池的最大上限，p1.apply_async(test)代码依旧会不停的执行，并不会停下等待；相当于向进程池提交了10个请求，会被放到一个队列中；
当执行完p1 = Pool(5)这条代码后，5条进程已经被创建出来了，只是还没有为他们各自分配任务，也就是说，无论有多少任务，实际的进程数只有5条，计算机每次最多5条进程并行。
当Pool中有进程任务执行完毕后，这条进程资源会被释放，pool会按先进先出的原则取出一个新的请求给空闲的进程继续执行；
当Pool所有的进程任务完成后，会产生5个僵尸进程，如果主线程不结束，系统不会自动回收资源，需要调用join函数去回收。
join函数是主进程等待子进程结束回收系统资源的，如果没有join，主程序退出后不管子进程有没有结束都会被强制杀死；
创建Pool池时，如果不指定进程最大数量，默认创建的进程数为系统的内核数量.

Pool对象分析

class Pool(object):

    def __init__(self, processes=None, initializer=None, initargs=(),

                 maxtasksperchild=None, context=None):

        pass

# 初始化参数

processes：进程池的大小，默认cpu内核的数量

initializer：创建进程执行的目标函数，其会按照进程池的大小创建相应个数的进程；

initargs：目标函数的参数

context：代码的上下文

# 方法

apply():使用阻塞方式调用func;

apply_async():使用非阻塞方式条用func；

close()：关闭Pool，使其不再接受新的任务；

terminate()：不管任务是否完成，立即终止；

join()：主进程阻塞，等待子进程的退出，必须在close()后面使用；

map(self, func, iterable, chunksize=None)：多进程执行一个函数，传入不同的参数；

starmap(self, func, iterable, chunksize=None)：和map类似，但iterable参数可解压缩；

starmap_async(self, func, iterable, chunksize=None, callback=None,error_callback=None):使用异步的方式的starmap，callback为返回后的处理函数

map_async(self, func, iterable, chunksize=None, callback=None,error_callback=None):异步方式的map

实例

from multiprocessing import Poolimport osdef test(n):

    time.sleep(1)

    print('this is process {}'.format(os.getpid()))    return ndef test1(n, m):

    print(n, m)

    print('this is process {}'.format(os.getpid()))def back_func(values): # 多进程执行完毕会返回所有的结果的列表

    print(values)def back_func_err(values): # 多进程执行完毕会返回所有错误的列表

    print(values)def get_pool(n=5):

    p = Pool(n)    # p.map(test, (i for i in range(10))) # 阻塞式多进程执行

    # p.starmap(test1, zip([1,2,3],[3,4,5])) # 阻塞式多进程执行多参数函数

    # 异步多进程执行函数

    p.map_async(test, (i for i in range(5)), callback=back_func, error_callback=back_func_err)    # 异步多进程执行多参数函数

    p.starmap_async(test1, zip([1,2,3],[3,4,5]), callback=back_func, error_callback=back_func_err)

    print('-----')

    p.close()

    p.join()if __name__ == '__main__':

    get_pool()

    print('ths process is ended')

进程锁

进程虽然不像线程那样共享内存的数据，而是每个进程有单独的内存，但多进程也是共享文件系统的，即硬盘系统；当多进程同时写入文件操作时，可能造成数据的破坏，因此进程也存在同步锁。

from multiprocessing import Pool, Lockmuex = Lock()def test():    if muex.acquire():

        f = open('./test_pro.txt', 'r+', encoding='utf-8')

        x = f.read()        if not x:

            f.write('0')        else:

            f.seek(0)

            f.write(str(int(x)+1))

        f.close()

        muex.release()if __name__ == '__main__':

    p = Pool(5)    for i in range(10):

        p.apply_async(test)

    p.close()

    p.join()    with open('./test_pro.txt', 'r+', encoding='utf-8') as f:

        print(f.read())

进程锁可以保证文件系统的安全，但是它使得并行变成了串行，效率下降了，也可能造成死锁问题，一般避免用锁机制。

参考
https://docs.python.org/

python之multiprocessing创建进程的更多相关文章

python的multiprocessing模块进程创建、资源回收-Process,Pool
python的multiprocessing有两种创建进程的方式,每种创建方式和进程资源的回收都不太相同,下面分别针对Process,Pool及系统自带的fork三种进程分析. 1.方式一:fork( ...
Python多进程库multiprocessing创建进程以及进程池Pool类的使用
问题起因最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似bag ...
【python小随笔】进程池 multiprocessing.Pool的简单实现与踩过的坑
#导入进程模块 import multiprocessing #创建进程池坑:一定要在循环外面创建进程池,不然会一直创建 pool = multiprocessing.Pool(30) for Si ...
Python之路(第三十七篇)并发编程：进程、multiprocess模块、创建进程方式、join()、守护进程
一.在python程序中的进程操作之前已经了解了很多进程相关的理论知识,了解进程是什么应该不再困难了,运行中的程序就是一个进程.所有的进程都是通过它的父进程来创建的.因此,运行起来的python程序 ...
python全栈开发 * 进程理论进程创建 * 180724
一.进程理论 1.进程是资源分配的最小单位. 2.进程调度就是多个进程在操作系统的控制下被CPU执行,去享用计算机的资源. 先来先服务短作业优先时间片轮转多级反馈队列 3.进程调度的过程是不能够 ...
Python多进程库multiprocessing中进程池Pool类的使用[转]
from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...
Python: 多进程的分布式进程multiprocessing.managers
multiprocessing.managers 在Thread和Process中,应当优选Process,因为Process更稳定,而且,Process可以分布到多台机器上,而Thread最多只能分 ...
Python之网路编程利用multiprocessing开进程
一.multiprocessing模块介绍 python中的多线程无法利用CPU资源,在python中大部分情况使用多进程.python中提供了非常好的多进程包multiprocessing. mul ...
Python创建进程、线程的两种方式
代码创建进程和线程的两种方式 """ 定心丸:Python创建进程和线程的方式基本都是一致的,包括其中的调用方法等,学会一个另一个自然也就会了. "" ...

随机推荐

Python之Web2py框架使用
本文主要是对Web2py框架的介绍和安装使用. 一. 介绍全栈式Web框架:Web2py是 Google 在 web.py 基础上二次开发而来的,兼容 Google App Engine .是一个为 ...
ICC Scenario Definition
现代先进工艺下的后端设计都是在 MCMM 情况下设计的,所谓 MCMM 就是 muti-corner muti-mode,用于芯片的不同工作模式和工作条件. 后端设计过程中,需要保证芯片在所有工作模 ...
Week5:Neural Network BackPropagation疑难点记录
1.这个neural network 的costfunction 看起来很复杂,其实把连加化简,就是上面的普通代价函数在神经网络的应用,只不过把每一层都加起来了. 为什么要初始化θ值? 后向传播涉及的 ...
spring cloud gateway之filter篇
转载请标明出处: https://www.fangzhipeng.com 本文出自方志朋的博客在上一篇文章详细的介绍了Gateway的Predict,Predict决定了请求由哪一个路由处理,在路由 ...
uboot的静默编译、指定编译目录、多核编译
最近在移植uboot,发现每次看源代码,都有编译留下的.o 等各种文件,在百度中,找到了解决方法. 在顶层的Makefile文件中,大概80多行,有这么几句注释, # kbuild supports ...
Installation failed: Timeout was reached: Operation timed out after 10000 milliseconds with 0 out of 0 bytes received
Trying this option worked for me. library(httr) with_config(use_proxy(...), install_github(...)) OR ...
2015306 白皎《网络攻防》Exp3 免杀原理与实践
2015306 白皎 <网络攻防>Exp3 免杀原理与实践一.实践基础免杀,故名思义,指的是一种能使病毒木马免于被杀毒软件查杀的技术. 免杀的方法有很多,比如加壳改壳.加垃圾指令.以及 ...
2017-2018-2 《网络对抗技术》 20155322 Exp4 恶意代码分析
[-= 博客目录 =-] 1-实践目标 1.1-实践介绍 1.2-实践内容 1.3-实践要求 2-实践过程 2.1-Mac下网络监控 2.2-Windows下网络监控 2.3-Mac下恶意软件分析 2 ...
查内存命令之free
磨砺技术珠矶,践行数据之道,追求卓越价值回到上一级页面: PostgreSQL杂记页回到顶级页面:PostgreSQL索引页 [作者高健@博客园 luckyjackgao@gmail. ...
Codeforces 862D. Mahmoud and Ehab and the binary string (二分)
题目链接:Mahmoud and Ehab and the binary string 题意: 一道交互题,首先给出一个字符串的长度l.现在让你进行提问(最多15次),每次提问提出一个字符串,会返回这 ...