Python Pool

　　我们在使用Python时，会经常需要使用多进程/多线程的情况，以便提高程序的运行效率，尤其是跟网络进行交互，如使用爬虫时。下面我们将简单看下Python的进程池的创建，map()、apply_async()、apply()的使用。

Pool

　　可以创建一个进程池，里面是一些工作者进程(Workers)，向其提交任务。

创建

class multiprocessing.pool.Pool([processes[, initializer[, initargs[, maxtasksperchild[, context]]]]]

processes：工作进程的数量，如果为None那么processes的值为os.cpu_count()返回的数量，即CPU的个数。
initializer：如果initializer是None，那么每一个工作进程在开始的时候会调用initializer(*initargs)。
maxtasksperchild：工作进程退出之前可以完成的任务数，完成后用一个新的工作进程来替代原进程，来让闲置的资源被释放。maxtasksperchild默认是None，意味着只要Pool存在工作进程就会一直存活。
context：用在制定工作进程启动时的上下文，一般使用 multiprocessing.Pool() 或者一个context对象的Pool()方法来创建一个池，两种方法都适当的设置了context。

成员函数

apply_async(func[, args[, kwds[, callback]]]) 它是非阻塞。
apply(func[, args[, kwds]])是阻塞的。
close() 关闭pool，使其不在接受新的任务。
terminate() 关闭pool，结束工作进程，不在处理未完成的任务。
join() 主进程阻塞，等待子进程的退出， join方法要在close或terminate之后使用。

map

map(func, iterable[, chunksize])　　

　　这种方法将iterable对象分成一些块，作为单独的任务提交给进程池。这些块的（近似）大小可以通过将chunksize设置为正整数来指定。

Sample:

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from multiprocessing import Pool

import time

def test(i):

    print i

    time.sleep(1)

if __name__ == '__main__':

    list = [1,2,3,4,5,6,7,8,9]

    pool = Pool(processes=2)

    pool.map(test, list)

    pool.close()

    pool.join()

apply

apply(func[, args[, kwds]])

　　创建的进程会去执行func函数，并且传递参数args和关键字参数kwds，阻塞型，其实可以看成是单进程，一个执行完毕之后才会执行下一个。

Sample:

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from multiprocessing import Pool

import time

def test(i):

    print i

    time.sleep(1)

if __name__ == '__main__':

    pool = Pool(processes=10)

    for i in range(1, 100, 1):

        # print i

        pool.apply(test, args=(i,))

    print 'test'

    pool.close()

    pool.join()

apply_async

apply_async(func[, args[, kwds[, callback[, error_callback]]]])

　　是上面介绍apply的非阻塞版/异步版。

Sample:

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from multiprocessing import Pool

import time

def test(i):

    print i

    time.sleep(1)

if __name__ == '__main__':

    pool = Pool(processes=10)

    for i in range(1, 100, 1):

        # print i

        pool.apply_async(test, args=(i,))

    print 'test'

    pool.close()

    pool.join()

　　apply_async可能也是我们倾向于使用的，大家可以分别运行一下示例，对比看看它们之间的不同。

References:

　　【Multiprocessing系列】Pool

　　Python官方文档:Process Pools

Python Pool的更多相关文章

python Pool并行执行
# -*- coding: utf-8 -*- import time from multiprocessing import Pool def run(fn): #fn: 函数参数是数据列表的一个元 ...
python中multiprocessing.pool函数介绍_正在拉磨_新浪博客
python中multiprocessing.pool函数介绍_正在拉磨_新浪博客 python中multiprocessing.pool函数介绍 (2010-06-10 03:46:5 ...
python(进程池/线程池)
进程池 import multiprocessing import time def do_calculation(data): print(multiprocessing.current_proce ...
Linux进程启动/指令执行方式研究
1. 通过glibc api执行系统指令 0x1:system() glibc api system是linux系统提供的函数调用之一,glibc也提供了对应的封装api. system函数的原型为: ...
python进程池：multiprocessing.pool
本文转至http://www.cnblogs.com/kaituorensheng/p/4465768.html,在其基础上进行了一些小小改动. 在利用Python进行系统管理的时候,特别是同时操作多 ...
[转载]python中multiprocessing.pool函数介绍
原文地址:http://blog.sina.com.cn/s/blog_5fa432b40101kwpi.html 作者:龙峰摘自:http://hi.baidu.com/xjtukanif/blo ...
python的multiprocessing模块进程创建、资源回收-Process,Pool
python的multiprocessing有两种创建进程的方式,每种创建方式和进程资源的回收都不太相同,下面分别针对Process,Pool及系统自带的fork三种进程分析. 1.方式一:fork( ...
python中的进程池:multiprocessing.Pool()
python中的进程池: 我们可以写出自己希望进程帮助我们完成的任务,然后把任务批量交给进程池进程池帮助我们创建进程完成任务,不需要我们管理.进程池:利用multiprocessing 下的Pool ...
[转]Python多进程并发操作中进程池Pool的应用
Pool类在使用Python进行系统管理时,特别是同时操作多个文件目录或者远程控制多台主机,并行操作可以节约大量的时间.如果操作的对象数目不大时,还可以直接使用Process类动态的生成多个进程,十 ...

随机推荐

Excelutil 工具类
1.说明:ExcelUtil主要用于获得单元格的数据和对对指定单元格中写入数据用! 相关代码如下: package main.java; import java.io.File; import jav ...
Oracle 数据库备份启用压缩以及remap
1. Oracle数据库进行备份恢复客户测试环境, 有时候需要从现场copy到公司, 压缩虽然能够减少部分空间大小,但是copy到虚拟机里面也时浪费很大量的磁盘,所以能够在备份恢复的过程中执行压缩最 ...
PHP qq第三方登录，install时，报Not Found
最近在学习qq的第三方登录,先在慕课网中观看了相关视频,懂了原理. 然后进行操作时,在下载好SDK后,在../install/install.html中,配置了相关的openid,oppkey,cal ...
laravel报404错误与NGINX报404错误区别
nginx自己配置的404页面和laravel配置的404页面:如果报了404 :执行laravel的404页面: 那这个404页面对nginx来说意味着什么 laravel 路由和页面找 ...
MFC各种属性设置
在使用MFC的时候经常需要对例如对话框的外观进行一些设置.MFC哪些属性的含义和设置可以参照博客: http://www.cnblogs.com/lzmfywz/archive/2012/04/20/ ...
深入理解JAVA虚拟机阅读笔记2——垃圾回收
线程私有的程序计数器.虚拟机栈和本地方法栈随线程而生,随线程而灭.栈中的栈帧随方法的进入和退出有条不紊的入栈和出栈. 而Java堆和方法区因为需要多大内存.创建多少对象都是不确定的,因此这两个区域是垃 ...
Ubuntu 12.04下LAMP环境搭建实录
方法一: 用tasksel可以方便安装dns server, lamp, kubuntu desktop, ubuntu desktop, xubuntu之类的软件包.这个软件在ubuntu serv ...
字符串使用replaceAll()方法报异常
对字符串使用replaceAll()方法替换 * ? + / | 等字符的时候会报以下异常 Dangling meta character '*' near index 0 这主要是因为这些符号在正则 ...
ldap添加memberof支持
安装请查看上一篇博客,传送门:https://www.cnblogs.com/crysmile/p/9470508.html 如果使用LDAP仅仅作为用户统一登录中心,则参考安装文档即可:如果ldap ...
016 Java中的动态代理
作者:nnngu GitHub:https://github.com/nnngu 博客园:http://www.cnblogs.com/nnngu 简书:https://www.jianshu.com ...

Python Pool

Pool

创建

成员函数

map

apply

apply_async

Python Pool的更多相关文章

随机推荐

热门专题