引言

multiprocessing是一个用于产生多进程的包，与threading模块的API类似。multiprocessing既可以实现本地的多进程，也可以实现远程的多进程。通过使用多个子进程而非线程可以绕开Python的全局解释器锁(GIL)，同时允许在多种系统平台使用。

1. Process 模块

1.1 Process介绍

Process模块是一个创建进程的模块，可以通过Process直接创建进程。

multiprocessing.Process(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None)

"""

参数介绍：

    1. group默认为None（目前未使用）

    2. target代表调用对象，即子进程执行的任务

    3. name为进程名称

    4. args调用对象的位置参数元组，args=(value1, value2, ...)

    5. kwargs调用对象的字典，kwargs={key1:value1, key2:value2, ...}
    6. daemon表示进程是否为守护进程，布尔值
　　 　


方法介绍：
　　Process.start() 启动进程，并调用子进程中的run()方法
　　Process.run() 进程启动时运行的方法，在自定义时必须要实现该方法
　　Process.terminate() 强制终止进程，不进行清理操作，如果Process创建了子进程，会导致该进程变成僵尸进程
　　Process.join() 阻塞进程使主进程等待该进程终止
　　Process.kill() 与terminate()相同
　　Process.is_alive() 判断进程是否还存活，如果存活，返回True
　　Process.close() 关闭进程对象，并清理资源，如果进程仍在运行则返回错误
　　

"""

注意：

在Windows中，由于没有fork(Linux中创建进程的机制)，在创建进程的时候会import启动该文件，而在import文件的时候又会再次运行整个文件，如果把Process()放在 if __name__ == '__main__' 判断之外，则Process()在被import的时候也会被运行，导致无限递归创建子进程导致报错，所以在Windows系统下，必须把Process()放在 if __name__ == '__main__' 的判断保护之下。
在子进程中不能使用input，因为输入台只显示在主进程中，故如果在子进程中使用input，会导致报错。

1.2 Process实例

from multiprocessing import Process

def main(name):

    print(f'{name}: Hello World')

if __name__ == '__main__':

    # 创建子进程

    p = Process(target=main, args=('LovefishO',))

    # 开始进程

    p.start()

    # 阻塞进程

    p.join()

例子

1.3 Process类实现

from multiprocessing import Process

class NewProcess(Process):

    def __init__(self, name):

        # 执行父类的init()

        super().__init__()  

        # 创建新参数

        self.name = name

    # 在自定义Process类时，必须实现run()方法

    def run(self):

        print(f'{self.name}: Hello World')

if __name__ == '__main__':

    # 创建一个新的子进程，并传入参数

    np = NewProcess('LovefishO')

    # 开始子进程

    np.start()

    # 加入阻塞，保证主进程在子进程之后结束

    np.join()

    print('主进程结束')      

# LovefishO: Hello World

# 主进程结束

1.4 守护进程

正常情况下，当子进程和主进程都结束时，程序才会结束。但是当我们需要在主进程结束时，由该主进程创建的子进程也必须跟着结束时，就需要使用守护进程。当一个子进程为守护进程时，在主进程结束时，该子进程也会跟着结束。

from multiprocessing import Process

def main(name):

    print(f'{name}: Hello World')

if __name__ == '__main__':

    # 创建守护进程, 设置daemon = True

    p = Process(target=main, daemon=True, args=('LovefishO',))

    # 开始进程

    p.start()

    # 阻塞进程

    p.join()

2. Pool 模块

2.1 Pool介绍

Pool模块控制着一个进程池，池中是可以执行很多任务的进程

multiprocessing.Pool(processes=None, initializer=None, initargs=(), maxtasksperchild=None, context=None)

"""

参数介绍：

    processes: 设置要使用的进程数量，如果 processes 为 None，则使用 os.cpu_count() 返回的值
    initializer: 是每个工作进程启动时要执行的可调用对象，默认为None

    maxtasksperchild: 工作进程退出之前可以完成的任务数，完成后用一个新的工作进程来替代原进程，为了释放闲置资源

    context: 可被用于指定启动的工作进程的上下文

"""

2.2 Pool中分派任务的方式

apply(func[, args[, kwds]])方法是阻塞，意味着当前的进程没有执行完的话，后续的进程需要等待该进程执行结束才能执行，实际上该方法是串行。
apply_async(func[, args[, kwds[, callback[, error_callback]]]])方法是异步非阻塞的，意味着不用等待当前进程执行完成，即可根据系统的调度切换进程，该方法是并行。
map(func, iterable[, chunksize])方法将iterable对象分成一些块，作为单独的任务提交给进程池。这些块的（近似）大小可以通过将chunksize设置为正整数来指定，并且该方法是阻塞的。如果可迭代对象很多时，会消耗较大的内存，可以考虑使用imap或imap_unordered。
map_async(func, iterable[, chunksize[, callback[, error_callback]]])方法是map的变种，是非阻塞的。
imap(func, iterable[, chunksize])该方法和map一样，只不过该方法适用于对大量数据的遍历，返回的结果顺序和输入相同。
imap_unordered(func, iterable[, chunksize])与imap()一样，只不过输出的顺序是任意的

2.3 Pool实例

from multiprocessing import Pool

def main(name, num):

    print(f'{num} {name}: Hello World')

if __name__ == '__main__':

    # 创建进程池

    p = Pool()

    for i in range(5):

        p.apply(func=main, args=('LovefishO', i, ))

    # 关闭进程池

    p.close()

    # 阻塞进程, 等待子进程执行结束

    p.join()

    print('主进程结束')

# 0 LovefishO: Hello World

# 1 LovefishO: Hello World

# 2 LovefishO: Hello World

# 3 LovefishO: Hello World

# 4 LovefishO: Hello World

# 主进程结束

Pool例子

3. Queue 模块

3.1 Queue介绍

由于进程彼此之间互相隔离，要实现进程间通信，multiprocessing提供了两种形式：队列(queue)和管道。队列可以简单的理解为一种特殊的列表，可以设置固定的长度，从左边插入数据，从右边获取数据，并满足先进先出。并且队列时进程安全的，即同一时刻只有一个进程能够对队列进行操作。

multiprocessing.Queue(maxsize)

"""

    参数介绍：

          maxsize：设置队列长度    

    方法介绍：

          qsize()：返回队列长度，该结果是不可靠的，因为在使用该方法时，队列中的数据仍在进行删除增加

          empty()：如果队列为空，则返回True，反之亦然，该状态不可靠

          full()：如果队列满了，则返回True，反之亦然，该状态不可靠

          put(obj[, block[, timeout]])：将obj放入队列

          get([block[, timeout]])：从队列中取出并返回对象
          close(): 当前进程不会在队列中放入对象

"""

3.2 Queue实例

from multiprocessing import Process, Queue

def product(queue, num):

    # 把obj插入队列

    queue.put(num)

    print(f'Product {num}')

def consumer(queue):

    # 从队列中获取数据

    temp = queue.get()

    print(f'consumer consumed {temp} product')

if __name__ == '__main__':

    # 创建队列

    q = Queue()

    # 生产商品

    for i in range(5):

        p1 = Process(target=product, args=(q, i, ))

        p1.start()

    # 消费生产的商品

    for i in range(5):

        p2 = Process(target=consumer, args=(q,))

        p2.start()

Queue例子

注意：

在使用队列时(Queue)如果要使用进程池则不能使用multiprocessing.Pool,而是应用使用multiprocessing.Manager().Pool()

3.3 Queue + Pool实例

import multiprocessing

def product(queue, num):

    # 把obj插入队列

    queue.put(num)

    print(f'Product {num}')

def consumer(queue):

    # 从队列中获取obj

    num = queue.get()

    print(f'consumer consumed {num} product')

if __name__ == '__main__':

    # 创建队列

    q = multiprocessing.Manager().Queue()

    # 创建进程池

    p = multiprocessing.Pool()

    # 生产商品

    for i in range(5):

        p.apply(func=product, args=(q, i,))

    # 消费生产的商品

    for i in range(5):

        p.apply(func=consumer, args=(q,))

    # 关闭进程池

    p.close()

    # 阻塞进程

    p.join()

    print('主进程结束')

# Product 0

# Product 1

# Product 2

# Product 3

# Product 4

# consumer consumed 0 product

# consumer consumed 1 product

# consumer consumed 2 product

# consumer consumed 3 product

# consumer consumed 4 product

# 主进程结束

Queue + Pool例子

4. Reference

Multiprocessing官方文档

参考博客

Python编程之多进程(multiprocessing)详解的更多相关文章

Python编程之定时任务(crontab)详解
引言 python-crontab是python模块,提供了对cron任务的访问,并使得我们可以通过python对crontab文件进行修改. 安装 pip install python-cronta ...
Python安装、配置图文详解(转载)
Python安装.配置图文详解目录: 一. Python简介二. 安装python 1. 在windows下安装 2. 在Linux下安装三. 在windows下配置python集成开发环境(I ...
【和我一起学python吧】Python安装、配置图文详解
Python安装.配置图文详解目录: 一. Python简介二. 安装python 1. 在windows下安装 2. 在Linux下安装三. 在windows下配置python集成开发环境( ...
Scala进阶之路-面向对象编程之类的成员详解
Scala进阶之路-面向对象编程之类的成员详解作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.Scala中的object对象及apply方法 1>.scala 单例对象 ...
Python调用windows下DLL详解
Python调用windows下DLL详解 - ctypes库的使用 2014年09月05日 16:05:44 阅读数:6942 在python中某些时候需要C做效率上的补充,在实际应用中,需要做部分 ...
Python包模块化调用方式详解
Python包模块化调用方式详解作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一般来说,编程语言中,库.包.模块是同一种概念,是代码组织方式. Python中只有一种模块对象类型 ...
python中的tcp示例详解
python中的tcp示例详解目录 TCP简介 TCP介绍 TCP特点 TCP与UDP的不同点 udp通信模型 tcp客户端 tcp服务器 tcp注意点 TCP简介 TCP介绍 TCP协议 ...
Python字符串切片操作知识详解
Python字符串切片操作知识详解这篇文章主要介绍了Python中字符串切片操作的相关资料,需要的朋友可以参考下一:取字符串中第几个字符 print "Hello"[0] 表 ...
Python API 操作Hadoop hdfs详解
1:安装由于是windows环境(linux其实也一样),只要有pip或者setup_install安装起来都是很方便的 >pip install hdfs 2:Client——创建集群连接 ...

随机推荐

netdata检测工具的安装与使用
Netdata 是一款 Linux 性能实时监测工具..以web的可视化方式展示系统及应用程序的实时运行状态(包括cpu.内存.硬盘输入/输出.网络等linux性能的数据). Netdata文档地址: ...
Logo小变动，心境大不同，SVG矢量动画格式网站Logo图片制作与实践教程(Python3)
原文转载自「刘悦的技术博客」https://v3u.cn/a_id_207 曾几何时,SVG(Scalable Vector Graphics)矢量动画图被坊间称之为一种被浏览器诅咒的技术,只因为糟糕 ...
servlet映射路径匹配解析
开头 servlet是javaweb用来处理请求和响应的重要对象,本文将从源码的角度分析tomcat内部是如何根据请求路径匹配得到处理请求的servlet的假设有一个request请求路径为/tex ...
luogu1419 寻找段落（二分，单调队列）
单调队列存坐标 #include <iostream> #include <cstdio> #include <cstring> #include <algo ...
Web 前端实战：Gitee 贡献图
前言这次要做的 Web 前端实战是一个 Gitee 个人主页下的贡献图(在线 Demo),偶尔做一两个,熟悉熟悉 JS 以及 jQ.整体来说这个案例并不难,主要是控制第一个节点以及最后一个节点处于星 ...
Word 文字多选方式有哪些？
Ctrl + 鼠标左键:不连续地选择文字. Shift + 鼠标左键:连续地选择文字. Alt + 鼠标左键:自由选择文字.
html弹出二选一窗口,然后根据点击执行对应的js方法
html弹出二选一窗口,然后根据点击执行对应的js方法 layer.confirm("我是弹出来的字", {btn:['确认','取消']}, function(){ ...方法1 ...
Sirni题解(最小生成树，埃氏筛)（继 Liang-梁）
目录前言题意思路一些建议前言本篇是对Liang-梁的Sirni(最小生成树,埃氏筛)的后继博客. 通篇原文:https://blog.csdn.net/qq_37555704/articl ...
【java】学习路径23-拆箱与装箱
拿Integer类型和int类型来举例子. 装箱,基本给引用.下面的代码相当于Integer i_test = Integer.valueOf("100"); 注意!过程是自动的. ...
简单创建一个SpringCloud2021.0.3项目（四）
目录 1. 项目说明 1. 版本 2. 用到组件 3. 功能 2. 上三篇教程 3. 日志处理 1. 创建日志公共模块 2. Eureka引入日志模块 4. 到此的功能代码 5. 注册中心换成naco ...

Python编程之多进程(multiprocessing)详解

引言