python之进程池与线程池

一、进程池与线程池介绍

池子使用来限制并发的任务数目，限制我们的计算机在一个自己可承受的范围内去并发地执行任务

当并发的任务数远远超过了计算机的承受能力时，即无法一次性开启过多的进程数或线程数时
就应该用池的概念将开启的进程数或线程数

池子内什么时候装进程：并发的任务属于计算密集型
池子内什么时候装线程：并发的任务属于IO密集型

不能无限的开进程，不能无限的开线程
最常用的就是开进程池，开线程池。其中回调函数非常重要
回调函数其实可以作为一种编程思想，谁好了谁就去掉

只要你用并发，就会有锁的问题，但是你不能一直去自己加锁吧
那么我们就用QUEUE，这样还解决了自动加锁的问题
由Queue延伸出的一个点也非常重要的概念。以后写程序也会用到
这个思想。就是生产者与消费者问题

二、Python标准模块--concurrent.futures（并发未来）

concurent.future模块需要了解的
1.concurent.future模块是用来创建并行的任务，提供了更高级别的接口，
为了异步执行调用
2.concurent.future这个模块用起来非常方便，它的接口也封装的非常简单
3.concurent.future模块既可以实现进程池，也可以实现线程池
4.模块导入进程池和线程池
from  concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor
还可以导入一个Executor,但是你别这样导，这个类是一个抽象类
抽象类的目的是规范他的子类必须有某种方法（并且抽象类的方法必须实现），但是抽象类不能被实例化
5.
  p = ProcessPoolExecutor(max_works)对于进程池如果不写max_works：默认的是cpu的数目,默认是4个
  p = ThreadPoolExecutor(max_works)对于线程池如果不写max_works：默认的是cpu的数目*5
6.如果是进程池，得到的结果如果是一个对象。我们得用一个.get()方法得到结果
  但是现在用了concurent.future模块，我们可以用obj.result方法
  p.submit(task,i)  #相当于apply_async异步方法
  p.shutdown()  #默认有个参数wite=True (相当于close和join)

那么什么是线程池呢？我们来了解一下

三、线程池

进程池：就是在一个进程内控制一定个数的线程
基于concurent.future模块的进程池和线程池 （他们的同步执行和异步执行是一样的）

 1 # 1.同步执行--------------

 2 from  concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor

 3 import os,time,random

 4 def task(n):

 5     print('[%s] is running'%os.getpid())

 6     time.sleep(random.randint(1,3))  #I/O密集型的，，一般用线程，用了进程耗时长

 7     return n**2

 8 if __name__ == '__main__':

 9     start = time.time()

10     p = ProcessPoolExecutor()

11     for i in range(10): #现在是开了10个任务， 那么如果是上百个任务呢，就不能无线的开进程，那么就得考虑控制

12         # 线程数了，那么就得考虑到池了

13         obj  = p.submit(task,i).result()  #相当于apply同步方法

14     p.shutdown()  #相当于close和join方法

15     print('='*30)

16     print(time.time() - start)  #17.36499309539795

17

18

19 # 2.异步执行-----------

20 # from  concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor

21 # import os,time,random

22 # def task(n):

23 #     print('[%s] is running'%os.getpid())

24 #     time.sleep(random.randint(1,3))  #I/O密集型的，，一般用线程，用了进程耗时长

25 #     return n**2

26 # if __name__ == '__main__':

27 #     start = time.time()

28 #     p = ProcessPoolExecutor()

29 #     l = []

30 #     for i in range(10): #现在是开了10个任务， 那么如果是上百个任务呢，就不能无线的开进程，那么就得考虑控制

31 #         # 线程数了，那么就得考虑到池了

32 #         obj  = p.submit(task,i)  #相当于apply_async()异步方法

33 #         l.append(obj)

34 #     p.shutdown()  #相当于close和join方法

35 #     print('='*30)

36 #     print([obj.result() for obj in l])

37 #     print(time.time() - start)  #5.362306594848633

基于concurrent.futures模块的进程池

 1 from  concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor

 2 from threading import currentThread

 3 import os,time,random

 4 def task(n):

 5     print('%s:%s is running'%(currentThread().getName(),os.getpid()))  #看到的pid都是一样的，因为线程是共享了一个进程

 6     time.sleep(random.randint(1,3))  #I/O密集型的，，一般用线程，用了进程耗时长

 7     return n**2

 8 if __name__ == '__main__':

 9     start = time.time()

10     p = ThreadPoolExecutor() #线程池 #如果不给定值，默认cup*5

11     l = []

12     for i in range(10):  #10个任务 # 线程池效率高了

13         obj  = p.submit(task,i)  #相当于apply_async异步方法

14         l.append(obj)

15     p.shutdown()  #默认有个参数wite=True (相当于close和join)

16     print('='*30)

17     print([obj.result() for obj in l])

18     print(time.time() - start)  #3.001171827316284

基于concurrent.futures模块的线程池

应用线程池（下载网页并解析）

from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor

import requests

import time,os

def get_page(url):

    print('<%s> is getting [%s]'%(os.getpid(),url))

    response = requests.get(url)

    if response.status_code==200:  #200代表状态：下载成功了

        return {'url':url,'text':response.text}

def parse_page(res):

    res = res.result()

    print('<%s> is getting [%s]'%(os.getpid(),res['url']))

    with open('db.txt','a') as f:

        parse_res = 'url:%s size:%s\n'%(res['url'],len(res['text']))

        f.write(parse_res)

if __name__ == '__main__':

    # p = ThreadPoolExecutor()

    p = ProcessPoolExecutor()

    l = [

        'http://www.baidu.com',

        'http://www.baidu.com',

        'http://www.baidu.com',

        'http://www.baidu.com',

    ]

    for url in l:

        res = p.submit(get_page,url).add_done_callback(parse_page) #这里的回调函数拿到的是一个对象。得

        #  先把返回的res得到一个结果。即在前面加上一个res.result() #谁好了谁去掉回调函数

                                # 回调函数也是一种编程思想。不仅开线程池用，开线程池也用

    p.shutdown()  #相当于进程池里的close和join

    print('主',os.getpid())

map函数的应用

# map函数举例

obj= map(lambda x:x**2 ,range(10))

print(list(obj))

#运行结果[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

可以和上面的开进程池/线程池的对比着看，就能发现map函数的强大了

 1 # 我们的那个p.submit(task,i)和map函数的原理类似。我们就

 2 # 可以用map函数去代替。更减缩了代码

 3 from  concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor

 4 import os,time,random

 5 def task(n):

 6     print('[%s] is running'%os.getpid())

 7     time.sleep(random.randint(1,3))  #I/O密集型的，，一般用线程，用了进程耗时长

 8     return n**2

 9 if __name__ == '__main__':

10     p = ProcessPoolExecutor()

11     obj = p.map(task,range(10))

12     p.shutdown()  #相当于close和join方法

13     print('='*30)

14     print(obj)  #返回的是一个迭代器

15     print(list(obj))

map函数应用

python之进程池与线程池的更多相关文章

python系列之 - 并发编程(进程池，线程池，协程)
需要注意一下不能无限的开进程,不能无限的开线程最常用的就是开进程池,开线程池.其中回调函数非常重要回调函数其实可以作为一种编程思想,谁好了谁就去掉只要你用并发,就会有锁的问题,但是你不能一直去自己加 ...
python并发编程之进程池，线程池，协程
需要注意一下不能无限的开进程,不能无限的开线程最常用的就是开进程池,开线程池.其中回调函数非常重要回调函数其实可以作为一种编程思想,谁好了谁就去掉只要你用并发,就会有锁的问题,但是你不能一直去自己加 ...
python自带的进程池及线程池
进程池 """ python自带的进程池 """ from multiprocessing import Pool from time im ...
python并发编程之进程池，线程池concurrent.futures
进程池与线程池在刚开始学多进程或多线程时,我们迫不及待地基于多进程或多线程实现并发的套接字通信,然而这种实现方式的致命缺陷是:服务的开启的进程数或线程数都会随着并发的客户端数目地增多而增多, 这会对 ...
Python并发编程之进程池与线程池
一.进程池与线程池 python标准模块concurrent.futures(并发未来) 1.concurrent.futures模块是用来创建并行的任务,提供了更高级别的接口,为了异步执行调用 2. ...
Python 37 进程池与线程池、协程
一:进程池与线程池提交任务的两种方式: 1.同步调用:提交完一个任务之后,就在原地等待,等任务完完整整地运行完毕拿到结果后,再执行下一行代码,会导致任务是串行执行 2.异步调用:提交完一个任务之后, ...
python 36 进程池、线程池
目录 1. 死锁与递归锁 2. 信号量Semaphor 3. GIL全局解释器锁:(Cpython) 4. IO.计算密集型对比 4.1 计算密集型: 4.2 IO密集型 5. GIL与Lock锁的区 ...
python进程池与线程池
为什么会进行池化? 一切都是为了效率,每次开启进程都会分配一个属于这个进程独立的内存空间,开启进程过多会占用大量内存,系统调度也会很慢,我们不能无限的开启进程. 进程池原来大概如下图假设有100个任 ...
python 之并发编程（进程池与线程池、同步异步阻塞非阻塞、线程queue）
9.11 进程池与线程池池子使用来限制并发的任务数目,限制我们的计算机在一个自己可承受的范围内去并发地执行任务池子内什么时候装进程:并发的任务属于计算密集型池子内什么时候装线程:并发的任务属于I ...

随机推荐

铁乐学python27_模块学习2
大部份内容摘自博客http://www.cnblogs.com/Eva-J/ collections模块在内置数据类型(dict.list.set.tuple)的基础上, collections模块 ...
springsource-tool-suite插件的在线安装
1 首先,确定你现在使用的eclipse属于哪个版本? 查看自己的eclipse平台的版本(我的eclipse平台版本是4.3) 2 根据eclipse版本,选择插件的版本官网:ht ...
docker及服务器遇到的坑
目录 DNS不可用修改docker查找源容器保持固定ip 查看docker连接容器间通信容器拷贝数据 php连接docker mysql 8.0出错authentication method ...
ZT 人生真的是一场马拉松吗？
中国合伙人:孟晓俊:生活应该是什么样的?自己提出的问题应该由自己来回答,别人的回答是别人的答案,是别人的生活,而你应该过自己的生活,不是别人的生活. 人生真的是一场马拉松吗? 投递人 itwr ...
Django 通过APNS推送消息
最近手上一个项目需要通过APNS向app推送消息,由于后端采用drf框架,在github上找了好多模块,最终发现pzanitti大神的推送模块 django-push-notifications 比较 ...
ABAP很厉害是怎么一种体验？
知乎上偶然看到这个问题,觉得很有意思,我也来回答一发. 我本科和研究生学的是计算机专业,做项目用C/C++,研究生三年项目的代码量大概在三到四万行左右.2007年大学毕业加入SAP成都研究院一直工作到 ...
Array.prototype.reduce 的理解与实现
Array.prototype.reduce 是 JavaScript 中比较实用的一个函数,但是很多人都没有使用过它,因为 reduce 能做的事情其实 forEach 或者 map 函数也能做,而 ...
Spring-IOC MethodInvokingFactoryBean 类源码解析
MethodInvokingFactoryBean MethodInvokingFactoryBean的作用是,通过定义类和它的方法,然后生成的bean是这个方法的返回值,即可以注入方法返回值. Me ...
P2245 星际导航
题目描述 sideman 做好了回到 Gliese星球的硬件准备,但是 sideman 的导航系统还没有完全设计好.为了方便起见,我们可以认为宇宙是一张有 N 个顶点和 M 条边的带权无向图,顶点表示 ...
programming-languages学习笔记--第10部分
programming-languages学习笔记–第10部分 */--> pre.src {background-color: #292b2e; color: #b2b2b2;} pre.sr ...

python之进程池与线程池

一、进程池与线程池介绍

二、Python标准模块--concurrent.futures（并发未来）

三、线程池

python之进程池与线程池的更多相关文章

随机推荐

热门专题