第17讲 | 一个线程两次调用start()方法会出现什么情况？

今天我们来深入聊聊线程，相信大家对于线程这个概念都不陌生，它是Java并发的基础元素，理解、操纵、诊断线程是Java工程师的必修课，但是你真的掌握线程了吗？

今天我要问你的问题是，一个线程两次调用start()方法会出现什么情况？谈谈线程的生命周期和状态转移。

典型回答

Java的线程是不允许启动两次的，第二次调用必然会抛出IllegalThreadStateException，这是一种运行时异常，多次调用start被认为是编程错误。

关于线程生命周期的不同状态，在Java 5以后，线程状态被明确定义在其公共内部枚举类型java.lang.Thread.State中，分别是：

新建（NEW），表示线程被创建出来还没真正启动的状态，可以认为它是个Java内部状态。
就绪（RUNNABLE），表示该线程已经在JVM中执行，当然由于执行需要计算资源，它可能是正在运行，也可能还在等待系统分配给它CPU片段，在就绪队列里面排队。
在其他一些分析中，会额外区分一种状态RUNNING，但是从Java API的角度，并不能表示出来。
阻塞（BLOCKED），这个状态和我们前面两讲介绍的同步非常相关，阻塞表示线程在等待Monitor lock。比如，线程试图通过synchronized去获取某个锁，但是其他线程已经独占了，那么当前线程就会处于阻塞状态。
等待（WAITING），表示正在等待其他线程采取某些操作。一个常见的场景是类似生产者消费者模式，发现任务条件尚未满足，就让当前消费者线程等待（wait），另外的生产者线程去准备任务数据，然后通过类似notify等动作，通知消费线程可以继续工作了。Thread.join()也会令线程进入等待状态。
计时等待（TIMED_WAIT），其进入条件和等待状态类似，但是调用的是存在超时条件的方法，比如wait或join等方法的指定超时版本，如下面示例：

public final native void wait(long timeout) throws InterruptedException;

终止（TERMINATED），不管是意外退出还是正常执行结束，线程已经完成使命，终止运行，也有人把这个状态叫作死亡。

在第二次调用start()方法的时候，线程可能处于终止或者其他（非NEW）状态，但是不论如何，都是不可以再次启动的。

考点分析

今天的问题可以算是个常见的面试热身题目，前面的给出的典型回答，算是对基本状态和简单流转的一个介绍，如果觉得还不够直观，我在下面分析会对比一个状态图进行介绍。总的来说，理解线程对于我们日常开发或者诊断分析，都是不可或缺的基础。

面试官可能会以此为契机，从各种不同角度考察你对线程的掌握：

相对理论一些的面试官可以会问你线程到底是什么以及Java底层实现方式。
线程状态的切换，以及和锁等并发工具类的互动。
线程编程时容易踩的坑与建议等。

可以看出，仅仅是一个线程，就有非常多的内容需要掌握。我们选择重点内容，开始进入详细分析。

知识扩展

首先，我们来整体看一下线程是什么？

从操作系统的角度，可以简单认为，线程是系统调度的最小单元，一个进程可以包含多个线程，作为任务的真正运作者，有自己的栈（Stack）、寄存器（Register）、本地存储（Thread Local）等，但是会和进程内其他线程共享文件描述符、虚拟地址空间等。

在具体实现中，线程还分为内核线程、用户线程，Java的线程实现其实是与虚拟机相关的。对于我们最熟悉的Sun/Oracle JDK，其线程也经历了一个演进过程，基本上在Java 1.2之后，JDK已经抛弃了所谓的Green Thread，也就是用户调度的线程，现在的模型是一对一映射到操作系统内核线程。

如果我们来看Thread的源码，你会发现其基本操作逻辑大都是以JNI形式调用的本地代码。

private native void start0();
private native void setPriority0(int newPriority);
private native void interrupt0();

这种实现有利有弊，总体上来说，Java语言得益于精细粒度的线程和相关的并发操作，其构建高扩展性的大型应用的能力已经毋庸置疑。但是，其复杂性也提高了并发编程的门槛，近几年的Go语言等提供了协程（coroutine），大大提高了构建并发应用的效率。于此同时，Java也在Loom项目中，孕育新的类似轻量级用户线程（Fiber）等机制，也许在不久的将来就可以在新版JDK中使用到它。

下面，我来分析下线程的基本操作。如何创建线程想必你已经非常熟悉了，请看下面的例子：

Runnable task = () -> {System.out.println("Hello World!");};
Thread myThread = new Thread(task);
myThread.start();
myThread.join();

我们可以直接扩展Thread类，然后实例化。但在本例中，我选取了另外一种方式，就是实现一个Runnable，将代码逻放在Runnable中，然后构建Thread并启动（start），等待结束（join）。

Runnable的好处是，不会受Java不支持类多继承的限制，重用代码实现，当我们需要重复执行相应逻辑时优点明显。而且，也能更好的与现代Java并发库中的Executor之类框架结合使用，比如将上面start和join的逻辑完全写成下面的结构：

Future future = Executors.newFixedThreadPool(1)
.submit(task)
.get();

这样我们就不用操心线程的创建和管理，也能利用Future等机制更好地处理执行结果。线程生命周期通常和业务之间没有本质联系，混淆实现需求和业务需求，就会降低开发的效率。

从线程生命周期的状态开始展开，那么在Java编程中，有哪些因素可能影响线程的状态呢？主要有：

线程自身的方法，除了start，还有多个join方法，等待线程结束；yield是告诉调度器，主动让出CPU；另外，就是一些已经被标记为过时的resume、stop、suspend之类，据我所知，在JDK最新版本中，destory/stop方法将被直接移除。
基类Object提供了一些基础的wait/notify/notifyAll方法。如果我们持有某个对象的Monitor锁，调用wait会让当前线程处于等待状态，直到其他线程notify或者notifyAll。所以，本质上是提供了Monitor的获取和释放的能力，是基本的线程间通信方式。
并发类库中的工具，比如CountDownLatch.await()会让当前线程进入等待状态，直到latch被基数为0，这可以看作是线程间通信的Signal。

我这里画了一个状态和方法之间的对应图：

Thread和Object的方法，听起来简单，但是实际应用中被证明非常晦涩、易错，这也是为什么Java后来又引入了并发包。总的来说，有了并发包，大多数情况下，我们已经不再需要去调用wait/notify之类的方法了。

前面谈了不少理论，下面谈谈线程API使用，我会侧重于平时工作学习中，容易被忽略的一些方面。

先来看看守护线程（Daemon Thread），有的时候应用中需要一个长期驻留的服务程序，但是不希望其影响应用退出，就可以将其设置为守护线程，如果JVM发现只有守护线程存在时，将结束进程，具体可以参考下面代码段。注意，必须在线程启动之前设置。

Thread daemonThread = new Thread();
daemonThread.setDaemon(true);
daemonThread.start();

再来看看Spurious wakeup。尤其是在多核CPU的系统中，线程等待存在一种可能，就是在没有任何线程广播或者发出信号的情况下，线程就被唤醒，如果处理不当就可能出现诡异的并发问题，所以我们在等待条件过程中，建议采用下面模式来书写。

// 推荐
while ( isCondition()) {
waitForAConfition(...);
}

// 不推荐，可能引入bug
if ( isCondition()) {
waitForAConfition(...);
}

Thread.onSpinWait()，这是Java 9中引入的特性。我在专栏第16讲给你留的思考题中，提到“自旋锁”（spin-wait, busy-waiting），也可以认为其不算是一种锁，而是一种针对短期等待的性能优化技术。“onSpinWait()”没有任何行为上的保证，而是对JVM的一个暗示，JVM可能会利用CPU的pause指令进一步提高性能，性能特别敏感的应用可以关注。

再有就是慎用ThreadLocal，这是Java提供的一种保存线程私有信息的机制，因为其在整个线程生命周期内有效，所以可以方便地在一个线程关联的不同业务模块之间传递信息，比如事务ID、Cookie等上下文相关信息。

它的实现结构，可以参考源码，数据存储于线程相关的ThreadLocalMap，其内部条目是弱引用，如下面片段。

static class ThreadLocalMap {
	static class Entry extends WeakReference<ThreadLocal<?>> {
    	/** The value associated with this ThreadLocal. */
    	Object value;
    	Entry(ThreadLocal<?> k, Object v) {
        	super(k);
    	value = v;
    	}
      }
   // …
}

当Key为null时，该条目就变成“废弃条目”，相关“value”的回收，往往依赖于几个关键点，即set、remove、rehash。

下面是set的示例，我进行了精简和注释：

private void set(ThreadLocal<?> key, Object value) {
	Entry[] tab = table;
	int len = tab.length;
	int i = key.threadLocalHashCode & (len-1);

	for (Entry e = tab[i];; …) {
    	//…
    	if (k == null) {
// 替换废弃条目
        	replaceStaleEntry(key, value, i);
        	return;
    	}
       }

	tab[i] = new Entry(key, value);
	int sz = ++size;
//  扫描并清理发现的废弃条目，并检查容量是否超限
	if (!cleanSomeSlots(i, sz) && sz >= threshold)
    	rehash();// 清理废弃条目，如果仍然超限，则扩容（加倍）
}

具体的清理逻辑是实现在cleanSomeSlots和expungeStaleEntry之中，如果你有兴趣可以自行阅读。

结合专栏第4讲介绍的引用类型，我们会发现一个特别的地方，通常弱引用都会和引用队列配合清理机制使用，但是ThreadLocal是个例外，它并没有这么做。

这意味着，废弃项目的回收依赖于显式地触发，否则就要等待线程结束，进而回收相应ThreadLocalMap！这就是很多OOM的来源，所以通常都会建议，应用一定要自己负责remove，并且不要和线程池配合，因为worker线程往往是不会退出的。

今天，我介绍了线程基础，分析了生命周期中的状态和各种方法之间的对应关系，这也有助于我们更好地理解synchronized和锁的影响，并介绍了一些需要注意的操作，希望对你有所帮助。

一课一练

关于今天我们讨论的题目你做到心中有数了吗？今天我准备了一个有意思的问题，写一个最简单的打印HelloWorld的程序，说说看，运行这个应用，Java至少会创建几个线程呢？然后思考一下，如何明确验证你的结论，真实情况很可能令你大跌眼镜哦。

请你在留言区写写你对这个问题的思考，我会选出经过认真思考的留言，送给你一份学习奖励礼券，欢迎你与我一起讨论。

你的朋友是不是也在准备面试呢？你可以“请朋友读”，把今天的题目分享给好友，或许你能帮到他。

精选留言

风动静泉

2018-06-14 12:07:54

一课一练:
使用了两种方式获取当前程序的线程数。
1、使用线程管理器MXBean
2、直接通过线程组的activeCount
第二种需要注意不断向上找父线程组，否则只能获取当前线程组，结果是1

结论:
使用以上两种方式获取的线程总数都是5个。
main
Attach Listener
Signal Dispatcher
Finalizer
Reference Handler

此外，如果使用的IDE是IDEA 直接运行会多一个Monitor Ctrl-break线程，这个是IDE的原因。debug模式下不会有这个线程。

作者回复

不错

2018-06-14 23:40:36
小文同学

2018-06-14 11:56:37

做了一个test分析老师的问题，观察到的情况如下：
JVM 启动 Hello World的线程分析
环境：
macOS + jdk8
检测获得
Thread[Reference Handler,10,system]
Thread[Finalizer,8,system]
Thread[main,5,main]
Thread[Signal Dispatcher,9,system]
Hello World!
其中：
Reference Handler：处理引用对象本身的垃圾回收
Finalizer：处理用户的Finalizer方法
Signal Dispatcher：外部jvm命令的转发器

在jdk6环境中
还有一个Attach Listener的线程
是负责接收外部命令的，如jmap、jstack

作者回复

不错

2018-06-14 23:39:56
爱折腾的老斑鸠

2018-06-14 07:41:50

theadlocal里面的值如果是线程池的线程里面设置的，当任务完成，线程归还线程池时，这个threadlocal里面的值是不是不会被回收？

作者回复

嗯，线程池一般不建议和thread local配合...

2018-06-14 23:44:56
行者

2018-06-14 08:50:24

“我们会发现一个特别的地方，通常幻象引用都会和引用队列配合清理机制使用，但是 ThreadLocal 是个例外，它并没有这么做。”
老师，Entry继承的是WeakReference，这个是弱引用吧。
main:
System.out.println("hello world");
ThreadGroup group = Thread.currentThread().getThreadGroup();
ThreadGroup topGroup = group;
while (group != null) {
topGroup = group;
group = group.getParent();
}
int nowThreads = topGroup.activeCount();
Thread[] lstThreads = new Thread[nowThreads];
topGroup.enumerate(lstThreads);
for (int i = 0; i < nowThreads; i++) {
System.out.println("线程number：" + i + " = " + lstThreads[i].getName());
}
out:
线程number：0 = Reference Handler // 计算对象是否可达？
线程number：1 = Finalizer // 回收对象时触发的finalize方法？
线程number：2 = Signal Dispatcher // 线程调度员
线程number：3 = main
线程number：4 = Monitor Ctrl-Break // 监控器，锁相关

作者回复

前面是翻译窜了，已经修正；后面大家用了很多方法，基本都可以，主要目的是结合前面的介绍加深理解

2018-06-14 23:33:42
黄启航

2018-07-09 00:48:14

杨老师您好，我有个疑问:

文章最后说"弱引用都会和引用队列配合清理工作，但是Threadlocal是个例外，它并没有这么做。这意味着，废弃项目的回收依赖显示地触发，否则就要等待线程的结束" 。

我的疑问：既然没有利用引用队列来实现自动清除，那TheadLocalMap内部的Entry继承WeakReference有何用意？能起到什么作用？
tyson

2018-06-14 09:58:06

1、站在应用程序方面，只创建了一个线程。
2、站在jvm方面，肯定还有gc等其余线程。

总结：
1、线程是系统调度的最小单元，应该是进程吧。线程是操作系统的资源，在运行的时候会打开文件描述符等。
2、 resume、stop、suspend等已经被废弃了
3、线程的等待和唤醒，建议使用reentrantlock的condition wait/notify方法
4、可以使用线程的join方法、countdownlatch、cyclicbarrier、future等进行线程的等待

作者回复

不错

2018-06-14 23:30:32
李二木

2018-06-15 15:56:29

现在觉得踩坑是一种很好学习方法

作者回复

同意

2018-06-17 01:20:25
李飞

2020-05-01 00:10:19

//线程数验证
System.out.println("hello world");
int activeCount = Thread.activeCount();
System.out.println("线程活跃数：" + activeCount);
Set<Thread> threadSet = Thread.getAllStackTraces().keySet();
for (Thread thread : threadSet) {
System.out.println("线程" + thread.getId() + ":" + thread.getName());
}

输出结果：
hello world
线程活跃数：1
线程3:Finalizer
线程4:Signal Dispatcher
线程2:Reference Handler
线程5:Attach Listener
线程1:main
苦行僧

2018-12-30 15:09:45

边看老师的讲课边反思工程代码
扬～

2018-11-24 16:28:07

等待与阻塞有什么区别呢

作者回复

范范谈有点晦涩，可以从线程进入、退出blocked/waiting的方法/条件来对比

2018-11-25 22:21:36
TonyEasy

2018-06-18 07:03:40

老师，我有一点疑问，在线程池里复用线程时是不是对同一个线程调用了多次.start()方法呢？

作者回复

不是的，工作线程一般不退出的，复用的是类似runnable这种

2018-06-20 00:03:53
mongo

2018-06-15 10:21:21

杨老师请教你，关于高并发和线程池，我刚刚入门，工作中没有涉及过这一块。我阅读了oracle java tutorial high level concurrency 章节，阅读并粗略理解了《并发编程实践》这本书，想进一步清晰我的理解，我现在苦于在实践练习方面不知道怎么进行。老师有什么具体可行的思路指点一下吗？留言圈里有好多大神，在这里同时也请教其他的朋友。谢谢老师，谢谢大家。

作者回复

下面章节就会覆盖这部分，我谈下自己的思路：大部分工程师是没有机会在工作中，全面使用并发的那些东西的，尤其是反馈读者中初学者不少；所以，我建议有个整体性体系有个了解，分清大体都有什么；然后可以选些实践场景，去实现用例代码。面试中大体也就够了，毕竟项目经验不是教程能解决的

2018-06-17 01:29:12
锐

2018-06-14 08:45:24

通常弱引用都会和引用队列配合清理机制使用，但是 ThreadLocal 是个例外，它并没有这么做。

这意味着，废弃项目的回收依赖于显式地触发，否则就要等待线程结束，进而回收相应 ThreadLocalMap！这就是很多 OOM 的来源

这个平时还真没注意

作者回复

嗯，为了生命周期的需求

2018-06-14 23:41:56
食指可爱多

2018-06-14 07:56:45

我了解确定线程有:任务线程，Main线程，垃圾回收线程，还有些线程没细心关注名字和用途，惭愧了。可以在业务线程中等待，然后在命令行用jstack看看当前jvm的线程堆栈。

作者回复

其他就包括我们前面章节说过的finalizer，各种cleaner等，还有事件处理等

2018-06-14 23:44:21
承香墨影

2020-04-17 16:33:51

Java 线程状态切换的图有问题，Runnable 到 Blocked 不包括阻塞 IO，在 Java 层面是不关心是否调用了阻塞API 的，此时不会切换线程状态，依然保持在 RUNNABLE 中。
天王

2019-12-18 08:53:17

17 一次线程多次调用start方法会提示IllegnalThreadStateException，1 线程生命周期的几个状态，在Java.lang.thread.state中，new线程刚创建还没真正启动的状态，runnable 就绪表示该线程已经在jvm中执行，执行需要计算资源，可能正在运行，也可能正在等待cpu分配cpu片段，在就绪队列排队，blocked，阻塞表示当前线程处于Monitor lock，比如线程试图获取某个锁，发现被其他线程占了，就会处于阻塞状态，等待waiting，比如生产者消费者模式，消费者条件未满足，让当前消费者等待，生产者去准备数据，通过notify等动作，通知消费者线程可以继续工作，计时等待，和进入等待的条件一样，调用方法是等待超时的方法，终止 terminated 不管意外退出还是自动终止，线程终止运行，也叫死亡，第二次调用start的时候，线程已经死亡或者处于非new的状态，所以会抛出异常 2 线程是什么线程是线程调度的基本单元，一个进城包含多个线程，作为任务真正的执行者，有自己的栈，寄存器和本地存储等，但是会和进城中其他线程共享文件描述符和虚拟地址空间，线程分为内核线程和用户线程，看Thread的源码，以JNI形式调用的本地代码，3 创建线程 new Thread().start() thread.join()，线程的方法，有start，join等待线程结束，yield告诉调度室，主动让出CPU，基类Object提供了一些基础方法，wait，notify，notifyAll等方法，如果一个线程持有Minitor锁，会让其他线程处于wait状态，直到其他线程notify或者notifyall，Daemon Thread 守护线程，长期存在的服务线程
高杰

2018-06-14 08:44:52

有几个弱引用，虚引用的地方，音频和文字对不上。把我搞晕了。
应该有2个线程，还有jvm的gc线程？还有第三个线程吗？

作者回复

翻译修正了，谢谢指出；你试试用比如最简单的jstack查看下，不止这些哦

2018-06-14 23:35:31
sunlight001

2018-06-14 07:58:00

threadlocal在放入值之后，在get出来之后，需要做remove操作，我这么理解对么？以前写的程序都没remove😄

作者回复

不用了，明确移除是好习惯

2018-06-14 23:42:38
Eason

2018-06-14 07:39:23

“比如，线程试图通过 synchronized 去获取某个锁，但是其他线程已经独占了，那么当前线程就会处于阻塞状态”这个例子换一个理解，感觉也是在等待其他线程做某些操作。在“阻塞”中也是在“等待”中？？

作者回复

wait和blocked是不同的

2018-06-14 23:46:00
孙剑平

2022-02-19 16:33:00

老师好，我们第二次调star方法是报错，我看是有个threadStatus的值变为2了，源码没有看到赋值的地方，这值是什么时候从0变为2的呢？