作者:汤圆

个人博客:javalover.cc

前言

前面我们在创建线程时,都是直接new Thread();

这样短期来看是没有问题的,但是一旦业务量增长,线程数过多,就有可能导致内存异常OOM,CPU爆满等问题

幸运的是,Java里面有线程池的概念,而线程池的核心框架,就是我们今天的主题,Executor

接下来,就让我们一起畅游在Java线程池的海洋中吧

本节会用银行办业务的场景来对比介绍线程池的核心概念,这样理解起来会很轻松

简介

Executor是线程池的核心框架;

和它相对应的有一个辅助工厂类Executors,这个类提供了许多工厂方法,用来创建各种各样的线程池,下面我们先看下几种常见的线程池

// 容量固定的线程池
Executor fixedThreadPool = Executors.newFixedThreadPool(5);
// 容量动态增减的线程池
Executor cachedThreadPool = Executors.newCachedThreadPool();
// 单个线程的线程池
Executor singleThreadExecutor = Executors.newSingleThreadExecutor();
// 基于调度机制的线程池(不同于上面的线程池,这个池创建的任务不会立马执行,而是定期或者延时执行)
Executor scheduledThreadPool = Executors.newScheduledThreadPool(5);

上面这些线程池的区别主要就是线程数量的不同以及任务执行的时机

下面让我们开始吧

文章如果有问题,欢迎大家批评指正,在此谢过啦

目录

  1. 线程池的底层类ThreadPoolExecutor
  2. 为啥阿里不建议使用 Executors来创建线程池?
  3. 线程池的生命周期 ExecutorService

正文

1. 线程池的底层类 ThreadPoolExecutor

在文章开头创建的几个线程池,内部都是有调用ThreadPoolExecutor这个类的,如下所示

public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}

这个类是Exexutor的一个实现类,关系图如下所示:

  • 其中Executors就是上面介绍的辅助工厂类,用来创建各种线程池

  • 接口ExecutorService是Executor的一个子接口,它对Executor进行了扩展,原有的Executor只能执行任务,而ExecutorService还可以管理线程池的生命周期(下面会介绍)

所以我们先来介绍下这个底层类,它的完整构造参数如下所示:

public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {

在介绍这些参数之前,我们可以先举个生活中的例子-去银行办业务;然后对比着来理解,会比较清晰

(图中绿色的窗口表示一直开着)

  • corePoolSize: 核心线程数,就是一直存在的线程(不管用不用);=》窗口的1号窗和2号窗
  • maximumPoolSize:最大线程数,就是最多可以创建多少个线程;=》窗口的1,2,3,4号窗
  • keepAliveTime:多余的线程(最大线程数 减去 核心线程数)空闲时存活的时间;=》窗口的3号窗和4号窗空闲的时间,如果超过keepAliveTime,还没有人来办业务,那么就会暂时关闭3号窗和4号窗
  • workQueue: 工作队列,当核心线程数都在执行任务时,再进来的任务就会添加到工作队列中;=》椅子,客户等待区
  • threadFactory:线程工厂,用来创建初始的核心线程,下面会有介绍;
  • handler:拒绝策略,当所有线程都在执行任务,且工作队列也满时,再进来的任务就会被执行拒绝策略(比如丢弃);=》左下角的那个小人

基本的工作流程如下所示:

上面的参数我们着重介绍下工作队列和拒绝策略,线程工厂下面再介绍

工作队列:

  • ArrayBlockingQueue:

    • 数组阻塞队列,这个队列是一个有界队列,遵循FIFO,尾部插入,头部获取
    • 初始化时需指定队列的容量 capacity
    • 类比到上面的场景,就是椅子的数量为初始容量capacity
  • LinkedBlockingQueue:
    • 链表阻塞队列,这是一个无界队列,遵循FIFO,尾部插入,头部获取
    • 初始化时可不指定容量,此时默认的容量为Integer.MAX_VALUE,基本上相当于无界了,此时队列可一直插入(如果处理任务的速度小于插入的速度,时间长了就有可能导致OOM)
    • 类比到上面的场景,就是椅子的数量为Integer.MAX_VALUE
  • SynchronousQueue:
    • 同步队列,阻塞队列的特殊版,即没有容量的阻塞队列,随进随出,不做停留
    • 类比到上面的场景,就是椅子的数量为0,来一个人就去柜台办理,如果柜台满了,就拒绝
  • PriorityBlockingQueue
    • 优先级阻塞队列,这是一个无界队列,不遵循FIFO,而是根据任务自身的优先级顺序来执行
    • 初始化可不指定容量,默认11(既然有容量,怎么还是无界的呢?因为它添加元素时会进行扩容)
    • 类比到上面的场景,就是新来的可以插队办理业务,好比各种会员

拒绝策略:

  • AbortPolicy(默认):

    • 中断策略,抛出异常 RejectedExecutionException;
    • 如果线程数达到最大,且工作队列也满,此时再进来任务,则抛出 RejectedExecutionException(系统会停止运行,但是不会退出)
  • DiscardPolicy:
    • 丢弃策略,丢掉新来的任务
    • 如果线程数达到最大,且工作队列也满,此时再进来任务,则直接丢掉(看任务的重要程度,不重要的任务可以用这个策略)
  • DiscardOldestPolicy:
    • 丢弃最旧策略,丢掉最先进入队列的任务(有点残忍了),然后再次执行插入操作
    • 如果线程数达到最大,且工作队列也满,此时再进来任务,则直接丢掉队列头部的任务,并再次插入任务
  • CallerRunsPolicy:
    • 回去执行策略,让新来的任务返回到调用它的线程中去执行(比如main线程调用了executors.execute(task),那么就会将task返回到main线程中去执行)
    • 如果线程数达到最大,且工作队列也满,此时再进来任务,则直接返回该任务,到调用它的线程中去执行

2. 为啥阿里不建议使用 Executors来创建线程池?

原话如下:

我们可以写几个代码来测试一下

先测试FixedThreadPool,代码如下:

public class FixedThreadPoolDemo {
public static void main(String[] args) {
// 创建一个固定容量为10的线程池,核心线程数和最大线程数都为10
ExecutorService executorService = Executors.newFixedThreadPool(10);
for (int i = 0; i < 1_000_000; i++) {
try{
executorService.execute(()->{
try {
Thread.sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
});
}catch (Exception e){
e.printStackTrace();
}
}
}
}

这里我们需对VM参数做一点修改,让问题比较容易复现

如下所示,我们添加-Xmx8m -Xms8m到VM option中(-Xmx8m:JVM堆的最大内存为8M, -Xms8m,JVM堆的初始化内存为8M):

此时点击运行,就会发现报错如下:

Exception in thread "main" java.lang.OutOfMemoryError: Java heap space
at java.util.concurrent.LinkedBlockingQueue.offer(LinkedBlockingQueue.java:416)
at java.util.concurrent.ThreadPoolExecutor.execute(ThreadPoolExecutor.java:1371)
at com.jalon.concurrent.chapter6.FixedThreadPoolDemo.main(FixedThreadPoolDemo.java:21)

我们来分析下原因

  • 首先,newFixedThreadPool内部用的工作队列为LinkedBlockingQueue,这是一个无界队列(容量最大为Integer.MAX_VALUE,基本上可一直添加任务)
  • 如果任务插入的速度,超过了任务执行的速度,那么队列肯定会越来越长,最终导致OOM

CachedThreadPool也是类似的原因,只不过它是因为最大线程数为Integer.MAX_VALUE;

所以当任务插入的速度,超过了任务执行的速度,那么线程的数量会越来越多,最终导致OOM

那我们要怎么创建线程池呢?

可以用ThreadPoolExecutor来自定义创建,通过为最大线程数和工作队列都设置一个边界,来限制相关的数量,如下所示:

public class ThreadPoolExecutorDemo {
public static void main(String[] args) {
ExecutorService service = new ThreadPoolExecutor(
1, // 核心线程数
1, // 最大线程数
60L, // 空闲时间
TimeUnit.MILLISECONDS,
new ArrayBlockingQueue<>(1), // 数组工作队列,长度1
new ThreadPoolExecutor.DiscardPolicy()); // 拒绝策略:丢弃
for (int i = 0; i < 1_000_000; i++) {
// 通过这里的打印信息,我们可以知道循环了3次
// 原因就是第一次的任务在核心线程中执行,第二次的任务放到了工作队列,第三次的任务被拒绝执行
System.out.println(i);
service.execute(()->{
// 这里会报异常,是因为执行了拒绝策略(达到了最大线程数,队列也满了,此时新进来的任务就会执行拒绝策略)
// 这里需要注意的是,抛出异常后,代码并不会退出,而是卡在异常这里,包括主线程也会被卡住(这个是默认的拒绝策略)
// 我们可以用其他的拒绝策略,比如DiscardPolicy,此时代码就会继续往下执行
System.out.println(Thread.currentThread().getName());
});
}
try {
Thread.sleep(1000);
System.out.println("主线程 sleep ");
} catch (InterruptedException e) {
e.printStackTrace();
}
}
}

3. 线程池的生命周期 ExecutorService

Executor接口默认只有一个方法void execute(Runnable command);,用来执行任务

任务一旦开启,我们就无法再去插手了,比如停止、监控等

此时就需要ExecutorService登场了,它是Executor的一个子接口,对其进行了扩展,方法如下:

public interface ExecutorService extends Executor {

    void shutdown(); // 优雅地关闭,这个关闭会持续一段时间,以等待已经提交的任务去执行完成(但是在shutdown之后提交的任务会被拒绝)

    List<Runnable> shutdownNow(); // 粗暴地关闭,这个关闭会立即关闭所有正在执行的任务,并返回工作队列中等待的任务

    boolean isShutdown();

    boolean isTerminated();

    // 用来等待线程的执行
// 如果在timeout之内,线程都执行完了,则返回true;
// 如果等了timeout,还没执行完,则返回false;
// 如果timeout之内,线程被中断,则抛出中断异常
boolean awaitTermination(long timeout, TimeUnit unit)
throws InterruptedException; <T> Future<T> submit(Callable<T> task); <T> Future<T> submit(Runnable task, T result);
}

从上面可以看到,线程池的生命周期分三步:

  1. 运行:创建后就开始运行
  2. 关闭:调用shutdown进入关闭状态
  3. 已终止:所有线程执行完毕

总结

  1. 线程池的底层类 ThreadPoolExecutor:核心概念就是核心线程数、最大线程数、工作队列、拒绝策略
  2. 为啥阿里不建议使用 Executors来创建线程池?:因为会导致OOM,解决办法就是自定义ThreadPoolExecutor,为最大线程数和工作队列设置边界
  3. 线程池的生命周期ExecutorService:运行状态(创建后进入)、关闭状态(shutdown后进入)、已终止状态(所有线程都执行完成后进入)

参考内容:

后记

愿你的意中人亦是中意你之人

Java并发-线程池篇-附场景分析的更多相关文章

  1. Java并发--线程池的使用

    在前面的文章中,我们使用线程的时候就去创建一个线程,这样实现起来非常简便,但是就会有一个问题: 如果并发的线程数量很多,并且每个线程都是执行一个时间很短的任务就结束了,这样频繁创建线程就会大大降低系统 ...

  2. Java并发线程池到底设置多大?

    前言 在我们日常业务开发过程中,或多或少都会用到并发的功能.那么在用到并发功能的过程中,就肯定会碰到下面这个问题 并发线程池到底设置多大呢? 通常有点年纪的程序员或许都听说这样一个说法 (其中 N 代 ...

  3. Java并发——线程池原理

    "池"技术对我们来说是非常熟悉的一个概念,它的引入是为了在某些场景下提高系统某些关键节点性能,最典型的例子就是数据库连接池,JDBC是一种服务供应接口(SPI),具体的数据库连接实 ...

  4. Java并发——线程池Executor框架

    线程池 无限制的创建线程 若采用"为每个任务分配一个线程"的方式会存在一些缺陷,尤其是当需要创建大量线程时: 线程生命周期的开销非常高 资源消耗 稳定性 引入线程池 任务是一组逻辑 ...

  5. Java调度线程池ScheduledThreadPoolExecutor源码分析

    最近新接手的项目里大量使用了ScheduledThreadPoolExecutor类去执行一些定时任务,之前一直没有机会研究这个类的源码,这次趁着机会好好研读一下. 该类主要还是基于ThreadPoo ...

  6. java并发线程池---了解ThreadPoolExecutor就够了

    总结:线程池的特点是,在线程的数量=corePoolSize后,仅任务队列满了之后,才会从任务队列中取出一个任务,然后构造一个新的线程,循环往复直到线程数量达到maximumPoolSize执行拒绝策 ...

  7. Java并发—线程池框架Executor总结(转载)

    为什么引入Executor线程池框架 new Thread()的缺点 每次new Thread()耗费性能 调用new Thread()创建的线程缺乏管理,被称为野线程,而且可以无限制创建,之间相互竞 ...

  8. Java并发 线程池

    线程池技术就是事先创建一批线程,这批线程被放入到一个池子里,在没有请求到达服务端时候,这些线程都是处于待命状态,当请求到达时候,程序会从线程池里取出一个线程,这个线程处理到达的请求,请求处理完毕,该线 ...

  9. java 并发线程池的理解和使用

    一.为什么要用线程池 合理利用线程池能够带来三个好处. 第一:降低资源消耗.通过重复利用已创建的线程降低线程创建和销毁造成的消耗. 第二:提高响应速度.当任务到达时,任务可以不需要的等到线程创建就能立 ...

随机推荐

  1. Linux系统(Centos7)最新版本Docker简易(yum)安装步骤

    Docker从1.13版本之后采用时间线的方式作为版本号,分为社区版CE和企业版EE. 社区版是免费提供给个人开发者和小型团体使用的,企业版会提供额外的收费服务,比如经过官方测试认证过的基础设施.容器 ...

  2. Salesforce LWC学习(三十二)实现上传 Excel解析其内容

    本篇参考:salesforce lightning零基础学习(十七) 实现上传 Excel解析其内容 上一篇我们写了aura方式上传excel解析其内容.lwc作为salesforce的新宠儿,逐渐的 ...

  3. PTA 中序输出叶子结点

    6-8 中序输出叶子结点 (10 分)   本题要求实现一个函数,按照中序遍历的顺序输出给定二叉树的叶结点. 函数接口定义: void InorderPrintLeaves( BiTree T); T ...

  4. [set]JZOJ 5821 手机信号

    Description

  5. java例题_07 字符串的处理

    1 /*7 [程序 7 处理字符串] 2 题目:输入一行字符,分别统计出其中英文字母.空格.数字和其它字符的个数. 3 程分析:利用 while 语句,条件为输入的字符不为'\n'. 4 */ 5 6 ...

  6. 第23 章 : Kubernetes API 编程范式

    Kubernetes API 编程范式 需求来源 首先我们先来看一下 API 编程范式的需求来源. 在 Kubernetes 里面, API 编程范式也就是 Custom Resources Defi ...

  7. 腾讯高级工程师带你完整体验Node.js开发实战

    Node.js拥有广大的 JavaScript程序员基础并且完全开源,它被广泛地用在 Web服务.开发工作流.客户端应用等诸多领域.在 Web 服务开发这个领域,业界对 Node.js 的接受程度最高 ...

  8. MySQL性能压力基准测试工具sysbench

    1.sysbench介绍 这里介绍一款MySQL数据库的压力测试软件sysbench,用它来进行基准测试. sysbench 是一个开源的.模块化的.跨平台的多线程性能测试工具, 可以用来进行CPU. ...

  9. Java网络编程快速上手(SE基础)

    参考资料:百度百科TCP协议 本文涉及Java IO流.异常的知识,可参考我的另外的博客 一文简述Java IO 一文简述JAVA内部类和异常 1.概述 计算机网络相关知识: OSI七层模型 一个报文 ...

  10. 基于sinc的音频重采样(二):实现

    上篇(基于sinc的音频重采样(一):原理)讲了基于sinc方法的重采样原理,并给出了数学表达式,如下:                  (1) 本文讲如何基于这个数学表达式来做软件实现.软件实现的 ...