多进程

进程之间是相互独立的,python是启动进程的时候,是启动的是原生进程。进程是没有GIL锁的,而且不存在锁的概念,进程之间的数据式不能共享的,而线程是可以的。

1、进程的定义

用muliprocessing这个包中的Process来定义多进程,跟定义多线程类似

from multiprocessing import Process   # 导入进程模块
import time def run(name):
time.sleep(2)
print("hello", name) if __name__ == "__main__":
p_obj_list = list() # 存放进程对象
for i in range(10): # 启动10个进程
p = Process(target=run, args=("QQ{0}".format(i),)) # 产生一个进程实例
p.start() # 启动进程
p_obj_list.append(p) for p in p_obj_list:
p.join() # 等待进程结果

2、进程中加入线程

from multiprocessing import Process
import time,threading def thread_run(name): # 定义线程执行的方法
print("{0}:{1}".format(name, threading.get_ident())) # thread.get_ident ()返回当前线程的标识符,标识符是一个非零整数 def run(name):
time.sleep(2)
print("hello", name)
t = threading.Thread(target=thread_run, args=(name,)) # 嵌入线程
t.start() # 执行线程 if __name__ == "__main__":
p_obj_list = list()
for i in range(10):
p = Process(target=run, args=("QQ{0}".format(i),))
p.start()
p_obj_list.append(p) for p in p_obj_list:
p.join()

3、父子进程

每个子进程都是由一个父进程启动的,每个程序也是有一个父进程

from multiprocessing import Process
import os def info(title):
print(title)
print('module name:', __name__)
print('parent process:', os.getppid()) # 获得父进程ID
print('process id:', os.getpid()) # 获得子进程ID
print("\n\n") def f(name):
info('\033[31;1m function f\033[0m')
print('hello', name) if __name__ == '__main__':
info('\033[32;1m main process line\033[0m')
p = Process(target=f, args=('QQ',))
p.start()
p.join()

  

进程间数据交互与共享

知道不同进程之间内存是不共享的,要想实现两个进程间的通信需要用到multiprocessing库中的queue(队列)模块,这个multiprocessing库中的queue模块跟单纯的queue库是不一样的。进程导入前者(这里的queue是专门为进程之间的通信设计的)不出错,导入后者(这里的queue主要是线程间数据交互)出错。

1、线程访问queue

import queue,threading

def f(q):
q.put([66, None, 'hello word']) if __name__ == '__main__':
q = queue.Queue() # 把这个q传给了子线程
p = threading.Thread(target=f, args=(q,)) # 子线程访问父线程的q
p.start()
print(q.get())
p.join() #执行结果
[66, None, 'hello word']

2、进程访问queue

from multiprocessing import Process
import queue def f(q):
q.put([66, None, 'hello word']) if __name__ == '__main__':
q = queue.Queue() # 把这个q传给了子线程
p = Process(target=f, args=(q,)) # 子线程访问父线程的q
p.start()
print(q.get())
p.join() #执行结果
Traceback (most recent call last):
File "C:/Users/dell/PycharmProjects/untitled/process/进程的定义.py", line 77, in <module>
p.start()
File "C:\Python36\lib\multiprocessing\process.py", line 105, in start
self._popen = self._Popen(self)
File "C:\Python36\lib\multiprocessing\context.py", line 223, in _Popen
return _default_context.get_context().Process._Popen(process_obj)
File "C:\Python36\lib\multiprocessing\context.py", line 322, in _Popen
return Popen(process_obj)
File "C:\Python36\lib\multiprocessing\popen_spawn_win32.py", line 65, in __init__
reduction.dump(process_obj, to_child)
File "C:\Python36\lib\multiprocessing\reduction.py", line 60, in dump
ForkingPickler(file, protocol).dump(obj)
TypeError: can't pickle _thread.lock objects

3、进程访问multiprocessing库中的Queue模块

from multiprocessing import Process,Queue

def f(q):
q.put([66, None, 'hello word']) if __name__ == '__main__':
q = Queue() # 把这个q传给了子线程
p = Process(target=f, args=(q,)) # 子线程访问父线程的q
p.start()
print(q.get())
p.join() #执行结果
[66, None, 'hello word']

父进程相当于克隆一个Q,把自己的Q克隆了一份交给子进程,子进程这个时候往Q里面放了一份数据,然后父进程又能实际的获取到。但是你克隆了一份是不是就和父进程没有关系了,为什么还能联系在一起呢?但是实际上:等于这两个Q里面的数据又把它序列化了,序列化到一个中间的地方,类似于翻译,然后反序列化给这个父进程这边来了,其实这两个Q就是通过pickle来序列化的,不是一个真正的Q。

小结:两个线程之间可以修改一个数据,不加锁,可能就会出错。现在进程中的Queue,是实现了数据的传递,不是在修改同一份数据,只是实现一个进程的数据传给了另外一个进程。

4、通过Pipe()实现进程间的数据交互,manger实现数据共享

上面的例子是通过进程中的Queue,来进行数据共享的,其实还有一种方式实现数据共享,那就是管道,pipe,以及数据共享manger。

4.1、Pipe()函数

管道函数会返回由管道双方连接的一组连接对象,该管道默认是双向的(双向的)。

from multiprocessing import Process, Pipe

def f(conn):
conn.send([66, None, 'hello,word']) # 发送消息给父进程
conn.close() if __name__ == '__main__':
parent_conn, child_conn = Pipe() # 管道生成返回两个实例,是双向的,这边把第1个作为父连接,第2个作为子连接。也可以,两者角色调换一下
p = Process(target=f, args=(child_conn,))
p.start()
print(parent_conn.recv()) # 接收子进程的消息
p.join()

4.2、接受多次和发送多次

from multiprocessing import Process, Pipe

def f(conn):
conn.send([66, None, 'hello,word']) # 发送消息给父进程
conn.send("QQ") # 发送消息给父进程
print(conn.recv()) # 接收父进程的消息
conn.close() if __name__ == '__main__':
parent_conn, child_conn = Pipe() # 管道生成返回两个实例,是双向的,这边把第1个作为父连接,第2个作为子连接。也可以,两者角色调换一下
p = Process(target=f, args=(child_conn,))
p.start()
print(parent_conn.recv())
print(parent_conn.recv()) # 接收两次
parent_conn.send("微信") # 发送给子进程
p.join()

4.3、manger

manger可以完成数据间的共享。

from multiprocessing import Process, Manager
import os def f(d, l):
d[os.getpid()] = os.getpid()
l.append(os.getpid())
print(l) if __name__ == '__main__':
with Manager() as manager:
d = manager.dict() # 声明一个字典,这个字典是用manger声明的,不是用dict()声明的
# manger.dict()是用专门的语法生产一个可在多进程之间进行传递和共享的一个字典
l = manager.list(range(5)) # 同样声明一个列表
p_list = []
for i in range(10):
p = Process(target=f, args=(d, l))
p.start()
p_list.append(p)
for res in p_list:
res.join()
print(d)
print(l)

线程修改同一份数据的时候需要加锁,进程修改数据呢:不用加锁,因为这个manger已经帮你加锁了,它就默认不允许两个进程同时修改一份数据。两个进程没有办法同时修改一份数据,进程之间是独立的,它自己也要加锁,因为它把自己的东西同时copy好几份,跟刚刚的那个Queue一样,copy10个字典最终合成一个字典

进程锁和进程池的使用

1、进程锁

通过multiprocessing中的Lock模块来实现进程锁

from multiprocessing import Process,Lock   # 导入进程锁

def f(l, i):
l.acquire() # 加锁
try:
print("hello word", i)
finally:
l.release() # 释放锁 if __name__ == "__main__":
lock = Lock() # 定义锁
for num in range(10):
Process(target=f, args=(lock, num,)).start() # 把锁传入进程中

进程中不是相互独立的吗?为什么还要加锁:虽然每个进程都是独立运行的,但是问题来了,它们共享一块屏幕。这个锁存在的意义就是屏幕共享。如果进程1想着打印数据,而进程2想也想打印数据的情况,就有可能乱套了,然后通过这个锁来控制,去打印的时候,这个屏幕只有我独占,导致屏幕不会乱。

2、进程池apply和apply_saync

2.1、appley

同步执行,也就是串行执行的

from multiprocessing import Pool  # 导入进程池模块pool
import time,os def foo(i):
time.sleep(2)
print("in process", os.getpid()) # 打印进程号 if __name__ == "__main__":
pool = Pool(processes=5) # 设置进程池个数为5,也可以写成pool = Pool(5),允许进程池同时放入5个进程,并且这5个进程交给cpu去运行
for i in range(10):
pool.apply(func=foo, args=(i,)) # 同步执行挂起进程
print('end')
pool.close()
pool.join() # 进程池中进程执行完毕后再关闭,如果注释,那么程序直接关闭。

2.2、apply_saync

异步执行,也就是并行执行。

from multiprocessing import Pool  # 导入进程池模块pool
import time,os def foo(i):
time.sleep(2)
print("in process", os.getpid()) # 打印进程号 if __name__ == "__main__":
pool = Pool(processes=5) # 设置进程池个数为5,也可以写成pool = Pool(5),允许进程池同时放入5个进程,并且这5个进程交给cpu去运行
for i in range(10):
pool.apply_async(func=foo, args=(i,)) # 采用异步方式执行foo函数
print('end')
pool.close()
pool.join() # 进程池中进程执行完毕后再关闭,如果注释,那么程序直接关闭。

2.3、异步下回调函数

程序执行完毕之后,再回调过来执行这个Bar函数。

from multiprocessing import Process,Pool
import time,os def foo(i):
time.sleep(2)
print("in process", os.getpid()) # 打印子进程的进程号 def bar(arg):
print('-->exec done:', arg, os.getpid()) # 打印进程号 if __name__ == "__main__":
pool = Pool(processes=2)
print("主进程", os.getpid()) # 主进程的进程号
for i in range(3):
pool.apply_async(func=foo, args=(i,), callback=bar) # 执行回调函数callback=Bar
print('end')
pool.close()
pool.join() # 进程池中进程执行完毕后再关闭,如果注释,那么程序直接关闭。 #执行结果
主进程 752
end
in process 2348
-->exec done: None 752
in process 8364
-->exec done: None 752
in process 2348
-->exec done: None 752

注:

  1. 回调函数说明fun=Foo干不完就不执行bar函数,等Foo执行完就去执行Bar
  2. 这个回调函数是主进程去调用的,而不是每个子进程去调用的。
  3. 回调函数的用处:

      比如说你从各个机器上备份完毕,在回调函数中自动写一个脚本,说备份完毕

  4. 回调函数是主进程调用的原因?

      如果是子进程去调用这个回调函数,有多少个子进程就有多少个连接,如果是主进程的话,只需要一次长连接就可以了,这个效率就高了

  

【python】-- 多进程的基本语法 、进程间数据交互与共享、进程锁和进程池的使用的更多相关文章

  1. Python 进程间数据交互

    进程间通信:进程之间必须需要中间件. 不同进程间内存是不共享的,要想实现两个进程间的数据交换     Queues:实现传输两个进程的数据 线程queue,访问数据只能在一个进程内进行线程与线程之间的 ...

  2. [转]WINDOW进程间数据通讯以及共享内存

    1.引言 在Windows程序中,各个进程之间常常需要交换数据,进行数据通讯.WIN32 API提供了许多函数使我们能够方便高效地进行进程间的通讯,通过这些函数我们可以控制不同进程间的数据交换,就如同 ...

  3. Python多进程-进程间数据的传递

    两个进程间的数据是独立的,要进行数据传递的话可通过几个方法 Queue 通过队列来进行进程间数据的传递 # -*- coding:utf-8 -*- __author__ = "MuT6 S ...

  4. Python进阶----进程间数据隔离, join阻塞等待, 进程属性, 僵尸进程和孤儿进程, 守护进程

    Python进阶----进程间数据隔离, join阻塞等待, 进程属性, 僵尸进程和孤儿进程, 守护进程 一丶获取进程以及父进程的pid 含义:    进程在内存中开启多个,操作系统如何区分这些进程, ...

  5. 子进程回收资源两种方式,僵尸进程与孤儿进程,守护进程,进程间数据隔离,进程互斥锁,队列,IPC机制,线程,守护线程,线程池,回调函数add_done_callback,TCP服务端实现并发

    子进程回收资源两种方式 - 1) join让主进程等待子进程结束,并回收子进程资源,主进程再结束并回收资源. - 2) 主进程 “正常结束” ,子进程与主进程一并被回收资源. from multipr ...

  6. python之 《进程之间数据交互和进程池》

    1.进程q 进程呢就相当于一个房子,线程就相当于是房子里面在工作的人,那么一个房子的空间对于房子里面的人来说是共享的, 现在是多进程,也就是说有许多房子,很显然这个房子的空间只属于这个房子,不会属于其 ...

  7. 04 . Vue组件注册,组件间数据交互,调试工具及组件插槽介绍及使用

    vue组件 组件(Component)是 Vue.js 最强大的功能之一. 组件可以扩展 HTML 元素,封装可重用的代码. 组件系统让我们可以用独立可复用的小组件来构建大型应用,几乎任意类型的应用的 ...

  8. python 使用多进程实现并发编程/使用queue进行进程间数据交换

    import time import os import multiprocessing from multiprocessing import Queue, pool ""&qu ...

  9. Python多进程-进程间数据的共享

    不同的进程不能同时修改一份数据,但是不同的进程能对一份数据进行修改 可通过Manager来实现进程间的数据共享 # -*- coding:utf-8 -*- __author__ = "Mu ...

随机推荐

  1. DevExpress控件之popupMenu

    一.首次创建 1.可直接从工具栏拉一个PopupMenu出来, 2.右键Customize,Yes(提示是否自动创建BarManager,并为popupmenu绑定这个BarManager): 3.编 ...

  2. 3D数学读书笔记——矩阵基础番外篇之线性变换

    本系列文章由birdlove1987编写.转载请注明出处. 文章链接:http://blog.csdn.net/zhurui_idea/article/details/25102425 前面有一篇文章 ...

  3. Win10系统如何关闭"启用病毒防护""启用Windows防火墙"提示?

    Win10系统如何关闭"启用病毒防护""启用Windows防火墙"提示?   目前已经有不少有用户升级到了win10正式版系统,不过有一些原win7/win8. ...

  4. xUtils介绍 -- DbUtils、ViewUtils、HttpUtils、BitmapUtils

    转载注明出处:https://github.com/wyouflf/xUtils xUtils简单介绍 xUtils 包括了非常多有用的android工具. xUtils 支持大文件上传,更全面的ht ...

  5. IIS7.5下的web.config 404应该如何配置

    IIS环境下web.config的配置的问题,在IIS7.5中添加配置404页面时遇到了一些问题,记录如下: 一开始在<customError>下的<error>节点配置404 ...

  6. HTML to PDF pechkin

    1. Goto Nuget 下载 Pechkin 控件 2. 创建需要打印的的PDF controller 和 Action, 这里会调用其他页面的内容进行打印. public ActionResul ...

  7. 关于汉诺塔,C++代码,代码效果演算

     1.故事介绍 汉诺塔:汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具.大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上依照大小顺序摞着64片黄金圆盘.大梵天命令婆罗门把圆盘 ...

  8. Android开发之Serializable 和 Parcelable的差别(源码分享)

    android 中自己定义的对象序列化的问题有两个选择一个是Parcelable,另外一个是Serializable. 一 序列化原因: 1.永久性保存对象.保存对象的字节序列到本地文件里. 2.通过 ...

  9. Lambda Expression in C#

    1.Expression Expression<Func<double, double>> exp = a => Math.Sin(a); 委托类型Func<dou ...

  10. SSH框架整合时,如果某一个action提交请求时数据校验失败,后续请求全部失败

    © 版权声明:本文为博主原创文章,转载请注明出处 1.问题描述 SSH框架搭建好进行验证时发现,执行某个请求时,若参数校验失败,修改参数符合要求后再次请求依然失败.该请求一直报错如下: No resu ...