concurrent.futures- 启动并行任务

python因为其全局解释器锁GIL而无法通过线程实现真正的平行计算。这个论断我们不展开，但是有个概念我们要说明，IO密集型 vs. 计算密集型。

IO密集型：读取文件，读取网络套接字频繁。

计算密集型：大量消耗CPU的数学与逻辑运算，也就是我们这里说的平行计算。

而concurrent.futures模块，可以利用multiprocessing实现真正的平行计算。

核心原理是：concurrent.futures会以子进程的形式，平行的运行多个python解释器，从而令python程序可以利用多核CPU来提升执行速度。由于子进程与主解释器相分离，所以他们的全局解释器锁也是相互独立的。每个子进程都能够完整的使用一个CPU内核。

一、初体验

Future总结

1. python3自带，python2需要安装

2. Executer对象

    它是一个抽象类，它提供了异步执行的方法，他不能直接使用，但可以通过它的子类

    ThreadPoolExecuter和ProcessPoolExecuter

2.1 Executer.submit(fn,*args,**kwargs)

    fn:需要异步执行的函数

    *args,**kwargs  fn接受的参数

    该方法的作用就是提交一个可执行的回调task，它返回一个Future对象

2.2 map(fn,*iterables, timeout=None, chunksize=1)

    map(task,URLS) # 返回一个map()迭代器，这个迭代器中的回调执行返回的结果是有序的

3. Future对象相关

    future可以理解为一个在未来完成的操作，这是异步编程的基础

    通常情况下我们在遇到IO操作的时候，将会发生阻塞，cpu不能做其他事情

    而future的引入帮助我们在这段等待时间可以完成其他的操作

3.1 done():

    如果当前线程已取消/已成功，返回True。

3.2 cance():

    如果当前线程正在执行，并且不能取消调用，返回Flase。否则调用取消，返回True

3.3 running():

    如果当前的线程正在执行，则返回True

3.4 result():

    返回调用返回的值，如果调用尚未完成，则此方法等待

    如果等待超时，会抛出concurrent.futures.TimeoutError

    如果没有指定超时时间，则等待无时间限制

    如果在完成之前，取消了Future，则会引发CancelledError

4. as_completed():

    在多个Future实例上的迭代器将会被返回

    这些Future实例由fs完成时产生。

    由fs返回的任何重复的Future，都会被返回一次。

    里面保存的都是已经执行完成的Future对象

5. wait():

    返回一个元祖，元祖包含两个元素

        1. 已完成的future集合

        2. 未完成的future集合

初体验

# coding=utf-8

from concurrent import futures

from concurrent.futures import Future

import time

def return_future(msg):

    time.sleep(3)

    return msg

pool = futures.ThreadPoolExecutor(max_workers=2)

t1 = pool.submit(return_future,'hello')

t2 = pool.submit(return_future,'world')

time.sleep(3)

print(t1.done())  # 如果顺利完成，则返回True

time.sleep(3)

print(t2.done())

print(t1.result()) # 获取future的返回值

time.sleep(3)

print(t2.result())

print("主线程")

map（func，* iterables，timeout = None，chunksize = 1 ）

# coding=utf-8

import time

from concurrent.futures import Future,as_completed

from concurrent.futures import ThreadPoolExecutor as Pool

import requests

import time

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):

    return requests.get(url=url,timeout=timeout)

pool = Pool()

result = pool.map(task,URLS)

start_time = time.time()

# 按照URLS的顺序返回

for res in result:

    print("{} {}".format(res.url,len(res.content)))

# 无序的

with Pool(max_workers=3) as executer:

    future_task = [executer.submit(task,url) for url in URLS]

    for f in as_completed(future_task):

        if f.done():

            f_ret = f.result() # f.result()得到task的返回值，requests对象

            print('%s, done, result: %s, %s' % (str(f), f_ret.url, len(f_ret.content)))

print("耗时",time.time() - start_time)

print("主线程")

二、Future对象

Future可以理解为一个未来完成的操作
当我们执行io操作的时候，在等待返回结果之前会产生阻塞
cpu不能做其他事情，而Future的引入帮助我们在等待的这段时间可以完成其他操作

from concurrent.futures import ThreadPoolExecutor as Pool

from concurrent.futures import as_completed

import requests

import time

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):

    return requests.get(url=url,timeout=timeout)

# start_time = time.time()

# for url in URLS:

#     ret = task(url)

#     print("{} {}".format(ret.url,len(ret.content)))

# print("耗时",time.time() - start_time)

with Pool(max_workers=3) as executor:

    # 创建future任务

    future_task = [executor.submit(task,url) for url in URLS]

    for f in future_task:

        if f.running():

            print("%s is running"%str(f))

    for f in as_completed(future_task):

        try:

            ret = f.done()

            if ret:

                f_ret = f.result()

                print('%s, done, result: %s, %s' % (str(f), f_ret.url, len(f_ret.content)))

        except Exception as e:

            f.cance()

            print(e)

"""

url不是按照顺序返回的，说明并发时，当访问某一个url时，如果没有得到返回结果，不会发生阻塞

<Future at 0x1c63990e6d8 state=running> is running

<Future at 0x1c639922780 state=running> is running

<Future at 0x1c639922d30 state=running> is running

<Future at 0x1c63990e6d8 state=finished returned Response>, done, result: http://www.baidu.com/, 2381

<Future at 0x1c639922780 state=finished returned Response>, done, result: https://www.qq.com?fromdefault, 243101

<Future at 0x1c639922d30 state=finished returned Response>, done, result: http://sina.com/, 23103

"""

三、模块方法

`concurrent.futures.wait`(fs, timeout=None, return_when=ALL_COMPLETED)

wait()会返回一个tuple，
tuple会包含两个集合
    1. 已完成的集合
    2. 未完成的集合
使用wait()会获得更大的自由度，他接受三个参数
FIRST_COMPLETED, FIRST_EXCEPTION和ALL_COMPLETE
默认为ALL_COMPLETE

from concurrent.futures import Future

from concurrent.futures import ThreadPoolExecutor as Pool

from concurrent.futures import as_completed,wait

import requests

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):

    return requests.get(url=url,timeout=timeout)

with Pool(max_workers=3) as execute :

    fulture_task = [execute.submit(task,url) for url in URLS]

    for f in fulture_task:

        if f.running():

            print("%s"%(str(f)))

    """

    并且wait还有timeout和return_when两个参数

    return_when有三个常量

    FIRST_COMPLETED 任何一个future_task执行完成时/取消时，改函数返回

    FIRST_EXCEPTION 任何一个future_task发生异常时，该函数返回，如果没有异常发生，等同于ALL_COMPLETED

    ALL_COMPLETED 当所有的future_task执行完毕返回

    """

    results = wait(fulture_task,return_when="FIRST_COMPLETED")#

    done = results[0]

    for d in done:

        print(d)

`concurrent.futures.as_completed`(fs, timeout=None)

在多个Future实例上的迭代器将会被返回
这些Future实例由fs完成时产生。
由fs返回的任何重复的Future，都会被返回一次。
里面保存的都是已经执行完成的Future对象

from concurrent.futures import ThreadPoolExecutor as Pool

from concurrent.futures import as_completed

import requests

import time

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):

    return requests.get(url=url,timeout=timeout)

with Pool(max_workers=3) as executor:

    # 创建future任务

    future_task = [executor.submit(task,url) for url in URLS]

    for f in future_task:

        if f.running():

            print("%s is running"%str(f))

    for f in as_completed(future_task):

        try:

            ret = f.done()

            if ret:

                f_ret = f.result()

                print('%s, done, result: %s, %s' % (str(f), f_ret.url, len(f_ret.content)))

        except Exception as e:

            f.cance()

            print(e)

concurrent.futures- 启动并行任务的更多相关文章

python concurrent.futures
python因为其全局解释器锁GIL而无法通过线程实现真正的平行计算.这个论断我们不展开,但是有个概念我们要说明,IO密集型 vs. 计算密集型. IO密集型:读取文件,读取网络套接字频繁. 计算密集 ...
Thread类的其他方法,同步锁,死锁与递归锁,信号量,事件,条件,定时器,队列,Python标准模块--concurrent.futures
参考博客: https://www.cnblogs.com/xiao987334176/p/9046028.html 线程简述什么是线程?线程是cpu调度的最小单位进程是资源分配的最小单位进程和线 ...
线程池、进程池(concurrent.futures模块)和协程
一.线程池 1.concurrent.futures模块介绍 concurrent.futures模块提供了高度封装的异步调用接口 ThreadPoolExecutor:线程池,提供异步调用 Pro ...
python 全栈开发，Day42(Thread类的其他方法,同步锁,死锁与递归锁,信号量,事件,条件,定时器,队列,Python标准模块--concurrent.futures)
昨日内容回顾线程什么是线程?线程是cpu调度的最小单位进程是资源分配的最小单位进程和线程是什么关系? 线程是在进程中的一个执行单位多进程本质上开启的这个进程里就有一个线程多线程单纯的在当 ...
python3 线程池-threadpool模块与concurrent.futures模块
多种方法实现 python 线程池一. 既然多线程可以缩短程序运行时间,那么,是不是线程数量越多越好呢? 显然,并不是,每一个线程的从生成到消亡也是需要时间和资源的,太多的线程会占用过多的系统资源( ...
Python开发【笔记】：concurrent.futures 平行运算
平行运算前言: 编写Python程序时,我们可能会遭遇性能问题,即使优化了代码,程序也依然有可能运行的很慢,从而无法满足我们对执行速度的要求,目前的计算机,其cpu核心数越来越多,于是,我们可以考虑 ...
网络编程基础--多线程---concurrent.futures 模块---事件Event---信号量Semaphore---定时器Timer---死锁现象递归锁----线程队列queue
1 concurrent.futures 模块: # from abc import abstractmethod,ABCMeta # # class A(metaclass=ABCMeta): # ...
Python之路(第四十六篇)多种方法实现python线程池(threadpool模块\multiprocessing.dummy模块\concurrent.futures模块)
一.线程池很久(python2.6)之前python没有官方的线程池模块,只有第三方的threadpool模块, 之后再python2.6加入了multiprocessing.dummy 作为可以使 ...
concurrent.futures模块简单介绍（线程池，进程池）
一.基类Executor Executor类是ThreadPoolExecutor 和ProcessPoolExecutor 的基类.它为我们提供了如下方法: submit(fn, *args, ** ...
python全栈开发，Day42（Thread类的其他方法，同步锁，死锁与递归锁，信号量，事件，条件，定时器，队列，Python标准模块--concurrent.futures）
昨日内容回顾线程什么是线程? 线程是cpu调度的最小单位进程是资源分配的最小单位进程和线程是什么关系? 线程是在进程中的一个执行单位多进程本质上开启的这个进程里就有一个线程多线程单纯的 ...

随机推荐

CodeChef题目选讲
https://wenku.baidu.com/view/2445a0322f60ddccda38a023.html 关键点:不超过7条根据咕咕原理,所以答案最少是N/7;(N小于49就暴力) 随机 ...
LOJ#2320 生成树计数
解:讲一个别的题解里我比较难以理解的地方,就是为什么可以把这两个东西合起来看成某一个连通块指数是2m而别的指数都是m. 其实很好理解,但是别人都略过了......把后面的∑提到∏的前面,然后展开,也可 ...
xor定理证明
xor 证明: 0 xor 0=0 0 xor 1=1 1 xor 0=1 1 xor 1=0 0 xor 其它数,数值不会改变1 xor 其它数,数值会反转所以x个数0和y个数1进行xor运算(0 ...
C#.Net 持久化对象为XML文件
</pre><pre code_snippet_id="613717" snippet_file_name="blog_20150307_1_57950 ...
条理清晰的搭建SSH环境之添加所需jar包
一.首先介绍要添加框架环境: JUnit Struts2 Hibernate Spring (1)配置JUnit /**-------------------------添加JUnit-------- ...
MySQL记录-Lost Connect MySQL Server during query解决方案
vim /etc/my.cnf ,在[mysqld]下面加上: skip-name-resolve max_allowed_packet = 800M default-character-set=ut ...
Study 7 —— while循环中止语句
循环的终止语句break #用于完全结束一个循环,跳出循环体执行循环后面的语句continue #只终止本次循环,接着执行后面的循环 1. 打印0-100,截止到第6次 count = 0 while ...
数据库索引实现（B+,B-,hash）
★ B-Tree索引:每一个叶子节点都包含指向下一个叶子节点的指针,从而方便叶子节点的范围遍历.B-Tree通常意味着所有的值都是按顺序存储的,并且每一个叶子页到根的距离相同,很适合查找范围数据. ★ ...
转--python 面试题
# 每一题都值得好好琢磨钻透 [原文地址](http://www.cnblogs.com/Allen-rg/p/7693394.html)1.Python是如何进行内存管理的? 答:从三个方面来说,一 ...
Netty 实现HTTP文件服务器
一,需求文件服务器使用HTTP协议对外提供服务.用户通过浏览器访问文件服务器,首先对URL进行检查,若失败返回403错误:若通过校验,以链接的方式打开当前目录,每个目录或文件都以超链接的形式展现,可 ...