最近由于项目需要一个与linux shell交互的多线程程序，需要用python实现，之前从没接触过python，这次匆匆忙忙的使用python，发现python确实语法非常简单，功能非常强大，因为自己是从零开始使用python，连语法都是现学的，所以将一些使用记录下来，希望能帮到大家。

使用python的需求简单的说是调用liunux下的ffmpeg获取音频的一些信息，需要用多线程实现

一、subprocess

因为是多线程，首先想到的是subprocess模块（官方文档说明此模块将会代替os模块和Popen2模块和command模块），这是python提供的开启子线程的标准库。可以通过pipe将子线程的stdin、stdout和stderr与主线程交互。

subprocess.call(["ls", "-l"])

subprocess.check_call(["ls", "-l"])

这是两个非常简单的例子，主线程都会等待子线程命令的完成，然后获取返回值，两个方法的唯一区别就是check_call会检查返回值，如果返回值不为0（即正确执行），则会抛出CalledProcessError异常。

Popen

那么我用的是Popen方法，实际上subprocess模块中其它的方法都是对Popen的封装，为了更方便的使用，如果我们自己需要定制某些功能，最后还是会回到Popen。

Popen具体的参数使用可以参考Python document

Popen接受元组为参数

child = subprocess.Popen(["ping","-c","","www.google.com"])

与上述方法不同的是，使用Popen，主线程不会等待子线程完成，如果要等待，需要使用wait()方法。

先上我使用的代码：

command = ["ffmpeg","-i",songPath];

stdoutData,stderrData = subprocess.Popen(command,stdout=subprocess.PIPE,stderr=subprocess.PIPE).communicate();

上面也提到了，使用Popen可以自定义标准输入、标准输出和标准错误输出。

那么在这行代码中，我定义了stdoutData和stderrData分别接受命令行程序的标准输出和标准错误输出（即stdout=subprocess.PIPE,stderr=subprocess.PIPE），都是通过管道（Pipe）实现。大家要注意，如果我们要在接下来的主线程中使用Popen方法执行命令行程序后的输出数据，如print(stdoutData)，那么记住使用Popen.wait()，因为主线程不会等待Popen执行完成。为什么我这里没有用呢？因为我这里使用了communicate方法，communicate方法代表子线程与主线程之间的通信，是阻塞式的，如果使用了communicate方法，主线程会等待子线程的完成。

其实从另一个层面上来说，也是linux标准输入输出的管道重定向，只不过是把标准输入输出重定向到程序而已。

按照这种方法，我就用ffmpeg获取到了音频的输出。

那么问题来了，说好的多线程呢？因为communicate方法是阻塞式的，并不能开启多线程。所以在思考过后，我决定用在主线程中开启多个子线程，分别调用subprocess模块去获取音频的信息。既然都是用到了多线程，考虑到效率问题，自然联想到了线程池。

二、线程池

为什么需要线程池呢？

设想一下，如果我们使用有任务就开启一个子线程处理，处理完成后，销毁子线程或等得子线程自然死亡，那么如果我们的任务所需时间比较短，但是任务数量比较多，那么更多的时间是花在线程的创建和结束上面，效率肯定就低了。

线程池的原理：

既然是线程池（Thread pool），其实名字很形象，就是把指定数量的可用子线程放进一个"池里"，有任务时取出一个线程执行，任务执行完后，并不立即销毁线程，而是放进线程池中，等待接收下一个任务。这样内存和cpu的开销也比较小，并且我们可以控制线程的数量。

线程池的实现：

线程池有很多种实现方式，在python中，已经给我们提供了一个很好的实现方式：Queue-队列。因为python中Queue本身就是同步的，所以也就是线程安全的，所以我们可以放心的让多个线程共享一个Queue。

那么说到线程池，那么理应也得有一个任务池，任务池中存放着待执行的任务，各个线程到任务池中取任务执行，那么用Queue来实现任务池是最好不过的。

先上代码：

class TaskManager():

    def __init__(self,maxTasks,maxThreads):

        #最大任务书，也就是Queue的容量

        self._maxTasks = maxTasks;

        #线程池中线程数量

        self._maxThreads = maxThreads;

        #业务代码

        ….

        ….

        #任务池

        self._taskQueue = Queue.Queue(maxTasks);

        #线程池，使用列表实现

        self._threads = [];

        #在__init__中调用方法

        self.initThreads();

        self.initTaskQueue();

    #初始化任务池

    def initTaskQueue(self):

        while True:

        #业务代码

            if not self._taskQueue.full():

                getTasks(self._maxTasks - self._taskQueue.qsize());

                for task in taskMap["tasks"]:

                self._taskQueue.put(task);

                time.sleep(1);

    #初始化线程池

    def initThreads(self):

        for i in range(self._maxThreads):

        #调用每个线程执行的具体任务

        self._threads.append(Work(self,self._reportUrl));

    def getTask(self):

        return self._taskQueue.get();

#具体执行的任务

class Work(threading.Thread):

    def __init__(self,taskmgr):

    threading.Thread.__init__(self);

    self._logger = logging.getLogger("");

    self.start();

    def run(self):

        while True:

            try:

                #取出任务并执行相关操作

                self._taskmgr.getTask();

                ……

                ……

                time.sleep(1);

            except Exception,e:

                self._logger.exception(e);

线程池的实现主要分两部分，一部分是TaskMagager，即任务管理类，用来调度任务，一部分是Work，即具体需要执行的业务代码。线程池的这种设计模式在很多地方都可以借鉴。

TaskManager

先来看TaskManager，主要包含四个方法，一个构造方法，接受传进来的参数，执行任务池和线程池的大小等初始化信息，然后调用initTaskQueue和initThread方法初始化任务池和线程池。

最后一个方法getTask返回TaskManager类的一个实例。

Work

执行具体的业务

过程分析

TaskManager的__init__方法初始化线程池和任务池
initTaskQueue方法，初始化任务池，将任务填充到任务队列。
initThreads方法，初始化线程池，调用Work类执行任务。
getTask方法，返回TaskManager实例，主要作用是传给Work类，让子线程从任务队列中取出任务执行。
Work类的__init__方法初始化线程，并启动线程。
Run方法，执行任务，并且从任务队列中取出任务。

关键点：

在主线程，也即TaskManager的initTaskQueue方法中获取任务并填充任务池
在各个子线程中，也即Work类的run方法中获取任务池中的任务并执行。

这里需要注意的是，前面提到过，Python中的Queue是线程安全的，Queue的get方法是阻塞式，也即，如果Queue为空，子线程取不到任务，会进行等待，直到Queue中有任务可取。

三、在TaskManager的__init__方法中，最好先启动线程，在启动任务池。

self.initThreads();

self.initTaskQueue();

否则在initTaskQueue（主线程）中的while循环会一直执行，将会阻塞线程池的执行。在第二点中说明过，先启动线程池，就算任务池没有任务，子线程也会阻塞等待任务池中出现新任务。

就写到这里，如果错误，请大家指正：）

Python 线程池的原理和实现及subprocess模块的更多相关文章

python线程池及其原理和使用
python线程池及其原理和使用 2019-05-29 17:05:20 whatday 阅读数 576 系统启动一个新线程的成本是比较高的,因为它涉及与操作系统的交互.在这种情形下,使用线程池可以很 ...
Python线程池及其原理和使用（超级详细）
系统启动一个新线程的成本是比较高的,因为它涉及与操作系统的交互.在这种情形下,使用线程池可以很好地提升性能,尤其是当程序中需要创建大量生存期很短暂的线程时,更应该考虑使用线程池. 线程池在系统启动时即 ...
python线程池ThreadPoolExecutor（上）（38）
在前面的文章中我们已经介绍了很多关于python线程相关的知识点,比如线程互斥锁Lock / 线程事件Event / 线程条件变量Condition 等等,而今天给大家讲解的是线程池ThreadP ...
Java线程池的原理及几类线程池的介绍
刚刚研究了一下线程池,如果有不足之处,请大家不吝赐教,大家共同学习.共同交流. 在什么情况下使用线程池? 单个任务处理的时间比较短将需处理的任务的数量大使用线程池的好处: 减少在创建和销毁线程上所 ...
并发编程（十二）—— Java 线程池实现原理与源码深度解析之 submit 方法（二）
在上一篇<并发编程(十一)—— Java 线程池实现原理与源码深度解析(一)>中提到了线程池ThreadPoolExecutor的原理以及它的execute方法.这篇文章是接着上一篇文章 ...
Java线程池实现原理与技术(ThreadPoolExecutor、Executors)
本文将通过实现一个简易的线程池理解线程池的原理,以及介绍JDK中自带的线程池ThreadPoolExecutor和Executor框架. 1.无限制线程的缺陷多线程的软件设计方法确实可以最大限度地发 ...
深入浅出JAVA线程池使用原理1
前言: Java中的线程池是并发框架中运用最多的,几乎所有需要异步或并发执行任务的程序都可以使用线程池,线程池主要有三个好处: 1.降低资源消耗:可以重复使用已经创建的线程降低线程创建和销毁带来的消耗 ...
自定义高级版python线程池
基于简单版创建类对象过多,现自定义高级版python线程池,代码如下 #高级线程池 import queue import threading import time StopEvent = obje ...
JUC回顾之-线程池的原理和使用
Java并发编程:线程池的使用 Java并发编程:线程池的使用在前面的文章中,我们使用线程的时候就去创建一个线程,这样实现起来非常简便,但是就会有一个问题: 如果并发的线程数量很多,并且每个线程 ...

随机推荐

（转）HTML特殊字符
HTML 原始码显示结果描述 < < 小於号或显示标记 > > 大於号或显示标记 & & 可用於显示其它特殊字符 " " 引号 ® ® ...
js添加onclick函数
document.getElementById('Add').setAttribute("onclick",AddNum()); 相当于不停的调用Addnum函数应改成docum ...
shell 中 2>&1 的使用
一相关知识 1)默认地,标准的输入为键盘,但是也可以来自文件或管道(pipe |). 2)默认地,标准的输出为终端(terminal),但是也可以重定向到文件,管道或后引号(backquotes ` ...
nginx环境下搭建nagios 3.5.0，及配置pnp4nagios画图
本文基于<LNMP最新源码安装脚本>,Nagios依赖PHP环境和perl环境,由于Nginx不支持Perl的CGI,需先来搭建Perl环境,Nagios原理介绍略.一.下载最新稳定源码包 ...
ASP.NET c#学习经验
1.DataGrid自定义字段.<Column <asp:BoundColumn DataField="khbh" HeaderText="客户编号&quo ...
assert实现
测试网站在国内国外的访问速度关于C的右左法则 assert宏的实现(一道笔试题) 2010-11-09 13:05:48| 分类: c | 标签: |举报 |字号大中小订阅 asser ...
让一个Activity在开机后自动显示
Activity本身不会在手机开机后自动运行的.但想让手机开机后就立刻做一些动作,需要使用广播接收器拦截手机开启广播,并在onReceive方法中完成相应的动作,如打开一个Activity. 广播接收 ...
Android基本组件-Activity
什么是Activity 在Android程序中,每个Activity继承自android.app.Activity, 有一个与之对应的xml布局文件, 一个界面对应一个Activity, 每个Acti ...
app.config动态修改及读取
1.添加应用程序配置文件右键点击项目,选择“添加”→“添加新建项”→“添加应用程序配置文件”将其添加到项目中. 2.设置配置文件 <?xmlversion="1.0"enc ...
sunJCE or ibmJce,was服务器下使用des的注意点
最近开发了一个应用,在tomcat下一切ok,到was上有报错. 打开debug日志,没有异常?? 继续调查发现是我们的程序引用了一个sun很久以前的jar.这个jar需要单独打开message日志 ...

Python 线程池的原理和实现及subprocess模块

二、线程池

Python 线程池的原理和实现及subprocess模块的更多相关文章

随机推荐

热门专题