初学Python——进程
什么是进程?
程序不能单独执行,只有将程序装载到内存中,系统为它分配资源才能运行,而这种执行的过程就叫做进程。进程是操作系统调度的最小单位。
程序和进程的区别在于:程序是储存在硬盘上指令的有序集合,是静态的;进程是内存中程序的一次执行过程,属于动态概念。
线程和进程的区别:
进程是资源的集合,进程要在CPU执行,必须要创建线程,至少要有一个线程在运行。
1.线程共享创建它的进程的地址空间。进程的内存空间是独立的。
2.线程可以直接访问其进程的数据段(不同线程共享同一个进程的数据),进程间不共享。
3.线程可以与其他线程进行通信,进程必须使用进程间通信(中间代理)与同级进程进行通信。
4.新的线程很容易创建,新的进程需要父进克隆。
5.线程可以直接操作和控制同一进程内的其它线程,而进程只能操作子进程。
6.对主线程的修改可能会影响到其它线程的行为。对父进程的修改不会影响子进程(不删除父进程的前提下)。
Python多进程的使用
Process 类用来描述一个进程对象。创建子进程的时候,只需要传入一个执行函数和函数的参数即可完成 Process 示例的创建。
star() 方法启动进程。
join() 方法实现进程间的同步,等待所有进程退出。
close() 用来阻止多余的进程涌入进程池 Pool 造成进程阻塞。
multiprocessing.Process(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None)
target 是函数名字,需要调用的函数
args 函数需要的参数,以 元组 的形式传入
multiprocessing模块的使用跟线程类似
import multiprocessing
import threading
import time def t_run():
print("线程号",threading.get_ident()) # 线程id def run(name):
time.sleep(1)
print('hello', name)
t = threading.Thread(target=t_run)
t.start() if __name__ == '__main__':
for i in range(10):
p = multiprocessing.Process(target=run, args=(i,))
p.start()
multiprocessing
所有的进程都是由父进程启动的,所以发现此程序的父进程ID正是PyCharm。
每个进程都是相互独立的,存在于不同的内存地址。
进程间通信
- 首先声明一点,这里所说的进程间通信指的是父子进程之间的通信机制。如果两个进程间没有关系,这里的机制是无法奏效的。
- 通信方式有:进程队列Queue、管道通信Pipe、共享数据Manger
1.进程队列Queue
进程队列直接使用multiprocessing模块的Queue类,不同于线程队列的queue模块。
import multiprocessing def f(q):
q.put([42, None, 'hello'])
q.put(30) if __name__ == '__main__':
q = multiprocessing.Queue()
p = multiprocessing.Process(target=f, args=(q,)) # 将队列copy一份传给子进程
p.start()
print(q.get()) # 在父进程中取出队列中数据
print(type(q.get()))
p.join()
进程队列
2.管道Pipe
两个进程在管道两边收发数据。
import multiprocessing '''Pipe管道实例,两个进程在管道两边收发数据''' def f(conn):
conn.send([42, None, 'hello']) # 发送数据
print("child_conn接收:",conn.recv()) # 接收数据
conn.close() def s(conn):
conn.send("你好,紫禁城") # 发送数据
print("parent_conn接收:",conn.recv()) # 接收数据
conn.close() if __name__ == '__main__':
parent_conn, child_conn = multiprocessing.Pipe() # 管道实例,连接着两个进程
p = multiprocessing.Process(target=f, args=(child_conn,))
p2 = multiprocessing.Process(target=s,args=(parent_conn,))
p.start()
p2.start()
#print(parent_conn.recv()) # 父进程接收管道的数据
#parent_conn.send("你好,紫禁城") # 父进程发送数据
p.join()
p2.join()
Pipe
3.进程间共享数据Manger
使用Manger()可以创建共享的数据,包括列表,字典,元组等多种类型。
from multiprocessing import Process, Manager def f(d, l):
d[1] = ''
d[''] = 2
d[0.25] = None
l.append(1)
print(l) if __name__ == '__main__':
with Manager() as manager:
d = manager.dict() l = manager.list(range(5))
p_list = []
for i in range(10):
p = Process(target=f, args=(d, l))
p.start()
p_list.append(p)
for res in p_list:
res.join() print(d)
print(l)
Manger
Lock
屏幕锁,防止一个进程未打印完毕,另一个进程插入
def f(l,i):
l.acquire()
print("hello",i)
l.release() if __name__ == '__main__':
l=Lock() for i in range(10):
Process(target=f,args=(l,i)).start()
lock
进程池
在利用Python进行系统管理的时候,特别是同时操作多个文件目录,或者远程控制多台主机,并行操作可以节约大量的时间。当被操作对象数目不大时,可以直接利用multiprocessing中的Process动态成生多个进程,10几个还好,但如果是上百个,上千个目标,手动的去限制进程数量却又太过繁琐,这时候进程池Pool发挥作用的时候就到了。
Pool可以提供指定数量的进程,供用户调用,当有新的请求提交到pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求;但如果池中的进程数已经达到规定最大值,那么该请求就会等待,直到池中有进程结束,才会创建新的进程来它。这里有一个简单的例子:
from multiprocessing import Process, Pool
import time, os def Foo(i):
time.sleep(5)
print('in process[Foo]', os.getpid())
return i + 100 def Bar(arg): # 父进程去执行,而不是子进程调用
print('-->exec done:', arg)
print('in process[Bar]', os.getpid()) if __name__ == '__main__':
pool = Pool(5) # 允许进程池里同时放入5个进程 其他多余的进程处于挂起状态 for i in range(10):
pool.apply_async(func=Foo, args=(i,), callback=Bar)
# pool.apply(func=Foo, args=(i,)) print('end:', os.getpid())
pool.close() # close() 必须在join()前被调用
pool.join() # 进程池中进程执行完毕后再关闭,如果注释,那么程序直接关闭。
进程池
- pool.apply_async()用来向进程池提交目标请求。
- pool.join()是用来等待进程池中的worker进程执行完毕,防止主进程在worker进程结束前结束。但pool.join()必须使用在pool.close()或者pool.terminate()之后。
- close()跟terminate()的区别在于close()会等待池中的worker进程执行结束再关闭pool,而terminate()则是直接关闭。
- result.successful()表示整个调用执行的状态,如果还有worker没有执行完,则会抛出AssertionError异常。
- 利用multiprocessing下的Pool可以很方便的同时自动处理几百或者上千个并行操作,脚本的复杂性也大大降低.
初学Python——进程的更多相关文章
- 初学Python
初学Python 1.Python初识 life is short you need python--龟叔名言 Python是一种简洁优美语法接近自然语言的一种全栈开发语言,由"龟叔&quo ...
- python——进程基础
我们现在都知道python的多线程是个坑了,那么多进程在这个时候就变得很必要了.多进程实现了多CPU的利用,效率简直棒棒哒~~~ 拥有一个多进程程序: #!/usr/bin/env python #- ...
- 使用gdb调试Python进程
使用gdb调试Python进程 有时我们会想调试一个正在运行的Python进程,或者一个Python进程的coredump.例如现在遇到一个mod_wsgi的进程僵死了,不接受请求,想看看究竟是运行到 ...
- python进程、线程、协程(转载)
python 线程与进程简介 进程与线程的历史 我们都知道计算机是由硬件和软件组成的.硬件中的CPU是计算机的核心,它承担计算机的所有任务. 操作系统是运行在硬件之上的软件,是计算机的管理者,它负责资 ...
- 无开发经验,初学python
1.无开发经验,初学python 如果你不会其他语言,python是你的第一门语言: A Byte of Python (简明python教程,这个有中文版简明 Python 教程)是非常好的入门 ...
- Python进程、线程、协程详解
进程与线程的历史 我们都知道计算机是由硬件和软件组成的.硬件中的CPU是计算机的核心,它承担计算机的所有任务. 操作系统是运行在硬件之上的软件,是计算机的管理者,它负责资源的管理和分配.任务的调度. ...
- python进程池剖析(一)
python中两个常用来处理进程的模块分别是subprocess和multiprocessing,其中subprocess通常用于执行外部程序,比如一些第三方应用程序,而不是Python程序.如果需要 ...
- python——进程、线程、协程
Python线程 Threading用于提供线程相关的操作,线程是应用程序中工作的最小单元. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 #!/usr/bin/env pytho ...
- 初学 Python(十五)——装饰器
初学 Python(十五)--装饰器 初学 Python,主要整理一些学习到的知识点,这次是生成器. #-*- coding:utf-8 -*- import functools def curren ...
随机推荐
- K8S RBAC
API Server 内部通过用户认证后,然后进入授权流程.对合法用户进行授权并且随后在用户访问时进行鉴权,是权限管理的重要环节. 在 kubernetes 集群中,各种操作权限是赋予角色(Role ...
- Visual Stuido Online:如何禁止多人同时签出同一文件
这里只说操作步骤,不讨论为什么要禁止同时多个签出同一文件. 版权声明:转载请保留原文链接. 友情链接:http://www.zhoumy.cn
- mysql学习之完整的select语句
本文内容: 完整语法 去重选项 字段别名 数据源 where group by having order by limit 首发日期:2018-04-11 完整语法: 先给一下完整的语法,后面将逐一来 ...
- OID的编解码(即在报文中的体现)
先上干货: 我们常见到OID的地方是SNMP和MIB,实际上理论上所有对象都可以有自己的ID.已存在的ID可以在http://www.oid-info.com/查到.这些ID在报文里并非字符串或直接的 ...
- Scala链式编程内幕
package big.data.analyse.scala /** * 链式编程原理 * Created by zhen on 2018/12/16. */ class Computer{def c ...
- [20181116]18c DML 日志优化.txt
[20181116]18c DML 日志优化.txt 1.环境:xxxxxxxx> select banner_full from v$version;BANNER_FULL---------- ...
- AI学习---分类算法[K-近邻 + 朴素贝叶斯 + 决策树 + 随机森林 ]
分类算法:对目标值进行分类的算法 1.sklearn转换器(特征工程)和预估器(机器学习) 2.KNN算法(根据邻居确定类别 + 欧氏距离 + k的确定),时间复杂度高,适合小数据 ...
- python opencv SIFT,获取特征点的坐标位置
备注:SIFT算法的实质是在不同的尺度空间上查找关键点(特征点),并计算出关键点的方向.SIFT所查找到的关键点是一些十分突出,不会因光照,仿射变换和噪音等因素而变化的点,如角点.边缘点.暗区的亮点及 ...
- Linux系统挂载Windows的共享文件夹
解决方案 在window上文件设置共享权限 在Linux上在 使用mount 命令挂载 Windows 共享文件夹 实验环境 redhat linux 7操作系统 服务器IP 192.168.100. ...
- mysql统计一年12月的数据
效果图: select end) as 一月份, end) as 二月份, end) as 三月份, end) as 四月份, end) as 五月份, end) as 六月份, end) as 七月 ...