第21讲 | Java并发类库提供的线程池有哪几种？分别有什么特点？

我在专栏第17讲中介绍过线程是不能够重复启动的，创建或销毁线程存在一定的开销，所以利用线程池技术来提高系统资源利用效率，并简化线程管理，已经是非常成熟的选择。

今天我要问你的问题是，Java并发类库提供的线程池有哪几种？分别有什么特点？

典型回答

通常开发者都是利用Executors提供的通用线程池创建方法，去创建不同配置的线程池，主要区别在于不同的ExecutorService类型或者不同的初始参数。

Executors目前提供了5种不同的线程池创建配置：

newCachedThreadPool()，它是一种用来处理大量短时间工作任务的线程池，具有几个鲜明特点：它会试图缓存线程并重用，当无缓存线程可用时，就会创建新的工作线程；如果线程闲置的时间超过60秒，则被终止并移出缓存；长时间闲置时，这种线程池，不会消耗什么资源。其内部使用SynchronousQueue作为工作队列。
newFixedThreadPool(int nThreads)，重用指定数目（nThreads）的线程，其背后使用的是无界的工作队列，任何时候最多有nThreads个工作线程是活动的。这意味着，如果任务数量超过了活动队列数目，将在工作队列中等待空闲线程出现；如果有工作线程退出，将会有新的工作线程被创建，以补足指定的数目nThreads。
newSingleThreadExecutor()，它的特点在于工作线程数目被限制为1，操作一个无界的工作队列，所以它保证了所有任务的都是被顺序执行，最多会有一个任务处于活动状态，并且不允许使用者改动线程池实例，因此可以避免其改变线程数目。
newSingleThreadScheduledExecutor()和newScheduledThreadPool(int corePoolSize)，创建的是个ScheduledExecutorService，可以进行定时或周期性的工作调度，区别在于单一工作线程还是多个工作线程。
newWorkStealingPool(int parallelism)，这是一个经常被人忽略的线程池，Java 8才加入这个创建方法，其内部会构建ForkJoinPool，利用Work-Stealing算法，并行地处理任务，不保证处理顺序。

考点分析

Java并发包中的Executor框架无疑是并发编程中的重点，今天的题目考察的是对几种标准线程池的了解，我提供的是一个针对最常见的应用方式的回答。

在大多数应用场景下，使用Executors提供的5个静态工厂方法就足够了，但是仍然可能需要直接利用ThreadPoolExecutor等构造函数创建，这就要求你对线程构造方式有进一步的了解，你需要明白线程池的设计和结构。

另外，线程池这个定义就是个容易让人误解的术语，因为ExecutorService除了通常意义上“池”的功能，还提供了更全面的线程管理、任务提交等方法。

Executor框架可不仅仅是线程池，我觉得至少下面几点值得深入学习：

掌握Executor框架的主要内容，至少要了解组成与职责，掌握基本开发用例中的使用。
对线程池和相关并发工具类型的理解，甚至是源码层面的掌握。
实践中有哪些常见问题，基本的诊断思路是怎样的。
如何根据自身应用特点合理使用线程池。

知识扩展

首先，我们来看看Executor框架的基本组成，请参考下面的类图。

我们从整体上把握一下各个类型的主要设计目的：

Executor是一个基础的接口，其初衷是将任务提交和任务执行细节解耦，这一点可以体会其定义的唯一方法。

void execute(Runnable command);

Executor的设计是源于Java早期线程API使用的教训，开发者在实现应用逻辑时，被太多线程创建、调度等不相关细节所打扰。就像我们进行HTTP通信，如果还需要自己操作TCP握手，开发效率低下，质量也难以保证。

ExecutorService则更加完善，不仅提供service的管理功能，比如shutdown等方法，也提供了更加全面的提交任务机制，如返回Future而不是void的submit方法。

<T> Future<T> submit(Callable<T> task);

注意，这个例子输入的可是Callable，它解决了Runnable无法返回结果的困扰。

Java标准类库提供了几种基础实现，比如ThreadPoolExecutor、ScheduledThreadPoolExecutor、ForkJoinPool。这些线程池的设计特点在于其高度的可调节性和灵活性，以尽量满足复杂多变的实际应用场景，我会进一步分析其构建部分的源码，剖析这种灵活性的源头。
Executors则从简化使用的角度，为我们提供了各种方便的静态工厂方法。

下面我就从源码角度，分析线程池的设计与实现，我将主要围绕最基础的ThreadPoolExecutor源码。ScheduledThreadPoolExecutor是ThreadPoolExecutor的扩展，主要是增加了调度逻辑，如想深入了解，你可以参考相关教程。而ForkJoinPool则是为ForkJoinTask定制的线程池，与通常意义的线程池有所不同。

这部分内容比较晦涩，罗列概念也不利于你去理解，所以我会配合一些示意图来说明。在现实应用中，理解应用与线程池的交互和线程池的内部工作过程，你可以参考下图。

简单理解一下：

工作队列负责存储用户提交的各个任务，这个工作队列，可以是容量为0的SynchronousQueue（使用newCachedThreadPool），也可以是像固定大小线程池（newFixedThreadPool）那样使用LinkedBlockingQueue。

private final BlockingQueue<Runnable> workQueue;

内部的“线程池”，这是指保持工作线程的集合，线程池需要在运行过程中管理线程创建、销毁。例如，对于带缓存的线程池，当任务压力较大时，线程池会创建新的工作线程；当业务压力退去，线程池会在闲置一段时间（默认60秒）后结束线程。

private final HashSet<Worker> workers = new HashSet<>();

线程池的工作线程被抽象为静态内部类Worker，基于AQS实现。

ThreadFactory提供上面所需要的创建线程逻辑。
如果任务提交时被拒绝，比如线程池已经处于SHUTDOWN状态，需要为其提供处理逻辑，Java标准库提供了类似ThreadPoolExecutor.AbortPolicy等默认实现，也可以按照实际需求自定义。

从上面的分析，就可以看出线程池的几个基本组成部分，一起都体现在线程池的构造函数中，从字面我们就可以大概猜测到其用意：

corePoolSize，所谓的核心线程数，可以大致理解为长期驻留的线程数目（除非设置了allowCoreThreadTimeOut）。对于不同的线程池，这个值可能会有很大区别，比如newFixedThreadPool会将其设置为nThreads，而对于newCachedThreadPool则是为0。
maximumPoolSize，顾名思义，就是线程不够时能够创建的最大线程数。同样进行对比，对于newFixedThreadPool，当然就是nThreads，因为其要求是固定大小，而newCachedThreadPool则是Integer.MAX_VALUE。
keepAliveTime和TimeUnit，这两个参数指定了额外的线程能够闲置多久，显然有些线程池不需要它。
workQueue，工作队列，必须是BlockingQueue。

通过配置不同的参数，我们就可以创建出行为大相径庭的线程池，这就是线程池高度灵活性的基础。

public ThreadPoolExecutor(int corePoolSize,
                      	int maximumPoolSize,
                      	long keepAliveTime,
                      	TimeUnit unit,
                      	BlockingQueue<Runnable> workQueue,
                      	ThreadFactory threadFactory,
                      	RejectedExecutionHandler handler)

进一步分析，线程池既然有生命周期，它的状态是如何表征的呢？

这里有一个非常有意思的设计，ctl变量被赋予了双重角色，通过高低位的不同，既表示线程池状态，又表示工作线程数目，这是一个典型的高效优化。试想，实际系统中，虽然我们可以指定线程极限为Integer.MAX_VALUE，但是因为资源限制，这只是个理论值，所以完全可以将空闲位赋予其他意义。

private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// 真正决定了工作线程数的理论上限 
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;
// 线程池状态，存储在数字的高位
private static final int RUNNING = -1 << COUNT_BITS;
…
// Packing and unpacking ctl
private static int runStateOf(int c)  { return c & ~COUNT_MASK; }
private static int workerCountOf(int c)  { return c & COUNT_MASK; }
private static int ctlOf(int rs, int wc) { return rs | wc; }

为了让你能对线程生命周期有个更加清晰的印象，我这里画了一个简单的状态流转图，对线程池的可能状态和其内部方法之间进行了对应，如果有不理解的方法，请参考Javadoc。注意，实际Java代码中并不存在所谓Idle状态，我添加它仅仅是便于理解。

前面都是对线程池属性和构建等方面的分析，下面我选择典型的execute方法，来看看其是如何工作的，具体逻辑请参考我添加的注释，配合代码更加容易理解。

public void execute(Runnable command) {
…
	int c = ctl.get();
// 检查工作线程数目，低于corePoolSize则添加Worker
	if (workerCountOf(c) < corePoolSize) {
    	if (addWorker(command, true))
        	return;
    	c = ctl.get();
	}
// isRunning就是检查线程池是否被shutdown
// 工作队列可能是有界的，offer是比较友好的入队方式
	if (isRunning(c) && workQueue.offer(command)) {
    	int recheck = ctl.get();
// 再次进行防御性检查
    	if (! isRunning(recheck) && remove(command))
        	reject(command);
    	else if (workerCountOf(recheck) == 0)
        	addWorker(null, false);
	}
// 尝试添加一个worker，如果失败意味着已经饱和或者被shutdown了
	else if (!addWorker(command, false))
    	reject(command);
}

线程池实践

线程池虽然为提供了非常强大、方便的功能，但是也不是银弹，使用不当同样会导致问题。我这里介绍些典型情况，经过前面的分析，很多方面可以自然的推导出来。

避免任务堆积。前面我说过newFixedThreadPool是创建指定数目的线程，但是其工作队列是无界的，如果工作线程数目太少，导致处理跟不上入队的速度，这就很有可能占用大量系统内存，甚至是出现OOM。诊断时，你可以使用jmap之类的工具，查看是否有大量的任务对象入队。
避免过度扩展线程。我们通常在处理大量短时任务时，使用缓存的线程池，比如在最新的HTTP/2 client API中，目前的默认实现就是如此。我们在创建线程池的时候，并不能准确预计任务压力有多大、数据特征是什么样子（大部分请求是1K 、100K还是1M以上？），所以很难明确设定一个线程数目。
另外，如果线程数目不断增长（可以使用jstack等工具检查），也需要警惕另外一种可能性，就是线程泄漏，这种情况往往是因为任务逻辑有问题，导致工作线程迟迟不能被释放。建议你排查下线程栈，很有可能多个线程都是卡在近似的代码处。
避免死锁等同步问题，对于死锁的场景和排查，你可以复习专栏第18讲。
尽量避免在使用线程池时操作ThreadLocal，同样是专栏第17讲已经分析过的，通过今天的线程池学习，应该更能理解其原因，工作线程的生命周期通常都会超过任务的生命周期。

线程池大小的选择策略

上面我已经介绍过，线程池大小不合适，太多或太少，都会导致麻烦，所以我们需要去考虑一个合适的线程池大小。虽然不能完全确定，但是有一些相对普适的规则和思路。

如果我们的任务主要是进行计算，那么就意味着CPU的处理能力是稀缺的资源，我们能够通过大量增加线程数提高计算能力吗？往往是不能的，如果线程太多，反倒可能导致大量的上下文切换开销。所以，这种情况下，通常建议按照CPU核的数目N或者N+1。
如果是需要较多等待的任务，例如I/O操作比较多，可以参考Brain Goetz推荐的计算方法：

线程数 = CPU核数 × 目标CPU利用率 ×（1 + 平均等待时间/平均工作时间）

这些时间并不能精准预计，需要根据采样或者概要分析等方式进行计算，然后在实际中验证和调整。

上面是仅仅考虑了CPU等限制，实际还可能受各种系统资源限制影响，例如我最近就在Mac OS X上遇到了大负载时ephemeral端口受限的情况。当然，我是通过扩大可用端口范围解决的，如果我们不能调整资源的容量，那么就只能限制工作线程的数目了。这里的资源可以是文件句柄、内存等。

另外，在实际工作中，不要把解决问题的思路全部指望到调整线程池上，很多时候架构上的改变更能解决问题，比如利用背压机制的Reactive Stream、合理的拆分等。

今天，我从Java创建的几种线程池开始，对Executor框架的主要组成、线程池结构与生命周期等方面进行了讲解和分析，希望对你有所帮助。

一课一练

关于今天我们讨论的题目你做到心中有数了吗？今天的思考题是从逻辑上理解，线程池创建和生命周期。请谈一谈，如果利用newSingleThreadExecutor()创建一个线程池，corePoolSize、maxPoolSize等都是什么数值？ThreadFactory可能在线程池生命周期中被使用多少次？怎么验证自己的判断？

请你在留言区写写你对这个问题的思考，我会选出经过认真思考的留言，送给你一份学习奖励礼券，欢迎你与我一起讨论。

你的朋友是不是也在准备面试呢？你可以“请朋友读”，把今天的题目分享给好友，或许你能帮到他。

精选留言

I am a psycho

2018-06-23 11:45:32

通过看源码可以得知，core和max都是1，而且通过FinalizableDelegatedExecutorService进行了包装，保证线程池无法修改。同时shutdown方法通过调用interruptIdleWorkers方法，去停掉没有工作的线程，而shutdownNow方法是直接粗暴的停掉所有线程。无论是shutdown还是shutdownNow都不会进行等待，都会直接将线程池状态设置成shutdown或者stop，如果需要等待，需要调用awaitTernination方法。查找了一下threadFactory的使用，只找到了在worker创建的时候，用来初始化了线程。

作者回复

不错，很棒的总结；
我问threadFactory次数，其实是问worker都在什么情况下会被创建，比如，比较特别的，任务抛异常时；随便自定义一个threadfactory，模拟提交任务就能体会到

2018-06-26 00:44:21
李二木

2018-06-23 13:29:09

我觉得还有一点很重要，就是放在线程池中的线程要捕获异常，如果直接抛出异常，每次都会创建线程，也就等于线程池没有发挥作用，如果大并发下一直创建线程可能会导致JVM挂掉。最近遇到的一个坑

作者回复

任务出异常是要避免

2018-06-26 00:58:05
Harry陈祥

2019-02-12 13:06:16

老师您好。有次面试，面试官问：为什么java的线程池当核心线程满了以后，先往blockingQueue中存任务，queue满了以后才会创建非核心线程？是在问，为什么要这么设计？
请问这个问题应该怎么回答？
Joshua

2018-06-23 11:12:11

疑问，为什么当初sun的线程池模式要设计成队列满了才能创建非核心线程？类比其他类似池的功能实现，很多都是设置最小数最大数，达到最大数才向等待队列里加入，比如有的连接池实现。

作者回复

Doug Lea这个实现基本是工业标准了，除非特定场景需求

2018-06-26 00:46:41
nb Ack

2019-05-22 09:37:59

阻塞性：
BlockQueue存入任务队列时是没有阻塞，使用的是offer，无阻塞添加方法。
BlockQueue取出任务队列时是有阻塞，有超时使用poll取值，无超时使用take阻塞方法取值

添加任务逻辑：
1.当任务数小于核心线程数，新建核心线程来执行任务
2.任务数大于核心线程数，队列不满，放入任务队列
3.任务数大于核心线程数，队列已满，新建线程执行
4.任务数大于核心线程数，队列已满，工作线程已达最大线程数，拒绝任务，抛出异常（而不是阻塞任务，等待进入队列）
沈琦斌

2018-06-28 23:47:52

老师，我想问的是cache的线程池大小是1，每次还要新创建，那和我自己创建而不用线程池有什么区别？

作者回复

你是说cachedthreadpool？那个大小是浮动的，不是1；如果说single，executorservice毕竟还提供了工作队列，生命周期管理，工作线程维护等很多事，还是要高效

2018-06-29 10:04:09
饭粒

2019-01-15 14:50:10

写了个简单demo玩了下。
创建线程池会初始化线程工厂，工作线程是在提交任务的创建的。工作线程在执行任务中抛出异常，再次提交任务会又新建工作线程。newFixedThreadPool 正常执行任务时会优先创建线程已达到核心线程数，不会优先复用空闲工作线程。
```
/**
* 线程池工作线程执行任务抛出异常
*/
@Test
public void test03() throws InterruptedException {
// java.util.concurrent.Executors.DefaultThreadFactory.DefaultThreadFactory 构造线程工厂
ExecutorService executorService = Executors.newCachedThreadPool();
Runnable task = new Runnable() {
@Override
public void run() {
System.out.println("hello world");
// 抛出异常
throw new RuntimeException();
}
};
executorService.execute(task);
// 提交任务通过 DefaultThreadFactory.newThread() 创建线程
TimeUnit.SECONDS.sleep(2);
// 前一个工作线程在执行任务中抛出异常，再提交任务又会新建工作线程
executorService.execute(task);

TimeUnit.SECONDS.sleep(3);
}
```

作者回复

实践是好习惯

2019-02-11 01:58:05
王磊

2018-06-25 13:21:11

core和max应该都是1。验证的方法是自己写一个Threadlocal, 里面有相应创建线程的日志，然后把它传入创建线程池。

作者回复

core和Max源码或者逻辑分析都很清楚；而创建线程次数理论上是不确定的，比如任务执行中抛异常，就要重新创建worker

2018-06-26 00:37:53
GK java

2019-01-26 16:15:49

线程池到底需不需要关闭

作者回复

通常建议明确关闭，要看具体场景，我们的应用对于关闭本身是如何定义，有没有要求，什么时机触发，需要保证优雅的退出吗？

2019-02-11 00:40:34
欣

2018-07-04 11:15:19

杨老师，我照着文章翻看源码，下面那块是不是不太对？
----------------
Executors 目前提供了 5 种不同的线程池创建配置：

newSingleThreadExecutor，它创建的是个 FinalizableDelegatedExecutorService

newSingleThreadScheduledExecutor 创建的是 ScheduledThreadPoolExecutor

作者回复

谢谢指出

2018-07-04 22:55:56
不告诉你

2019-02-22 08:46:08

无论是创建核心线程还是非核心线程，都需要获取全局锁。只有在工作队列满了以后才去创建非核心线程，应该就是为了在时间上尽量延后非核心线程的创建，为了线程池的性能做考虑吧。
Ifdevil

2019-03-04 22:26:54

老师您好，我看了线程池源码，里面是用HashSet存放worker的，为什么这里用hashset呢？去重？线程池需要去重吗？
镰仓

2018-06-28 20:45:06

听了一段时间课程，质量很高。我的需求是android JavaVM

作者回复

android我并没有特别的经验，尽管很多方面是通用的

2018-06-29 10:05:14
Seven.Lin澤耿

2020-03-07 23:28:59

corePoolSize=maxPoolSize=1

ThreadFactory threadFactory = new ThreadFactory(){
@Override
public Thread newThread(Runnable r) {
System.out.println("new thread ...");
return new Thread(r,"Thread-"+System.currentTimeMillis());
}
};

ExecutorService executorService = Executors.newSingleThreadExecutor(threadFactory);

executorService.execute(()->{
System.out.println("A Run");
});

executorService.execute(()->{
System.out.println("B Run Exception");
throw new RuntimeException();
});

executorService.execute(() -> {
System.out.println("C Run");
});

结果，发生两次创建线程，也就是发生异常之后，原先线程会被替换掉，具体看ThreadPoolExecutor的processWorkerExit()方法
何義

2019-12-22 23:09:44

请教一下，多线程下面是否可以再嵌套多线程
灰飞灰猪不会灰飞.烟灭

2018-06-25 07:34:54

老师放入队列中的线程是直接调用start方法还是把队列中的线程放入线程工厂，让线程工厂执行？
另外，怎么判断一个线程是否执行完成呢？（只有执行完成才返回结果）谢谢老师

作者回复

工厂是创建线程；执行完成通常是说任务，而不是线程，任务才是我们关心的；可以用Future

2018-06-26 00:29:27
念头通达

2020-04-16 22:28:34

原来SingleThreadPoolExecutor是使用LingkBlockQueue维护工作队列，第一个节点创建Worker 线程，之后的线程使用 enqueue(node)方法构建链
康

2019-03-03 22:46:45

我的理解，设置非核心线程的目的是防止任务数的段时间激增，导致任务数过多，从而核心线程处理时间太长。正常情况下要保证线程数小于核心线程数，非核心线程会过一段时间就被移出，保证了资源的利用，而核心一般不会变少
JasonLai

2019-02-10 21:03:18

老师你好，我在学些线程池时候遇到一个说法，创建线程池不推荐使用executors
而是使用threadpoolexecutor去创建。首先executor都是继承于threadpoolexecutor 其次是编写的线程池更为明确运行规则，有助于规避资源耗尽的风险。请老师分析下这种说法，其次是您的观点

作者回复

看应用是否有类似高并发、高负载等需求，如果没有，简便的方法也许就足够了；如果有，用构造函数创建是可取的，例如，可以限制最大线程数目，避免过度创建线程而OOM等

2019-02-11 01:25:51
饭粒

2019-01-15 10:36:36

Geotz那本java并发实战线程池大小计算还有个CPU利用率？
线程数 = CPU 核数 × CPU利用率 ×（1 + 平均等待时间 / 平均工作时间）

作者回复

难道我记错了...我去翻一下

2019-02-10 23:37:16