13 | 热点问题答疑（1）：如何学习源码？

不知道你有没有留意到，不少高端开发岗位在招聘要求里往往会写这么一条：研究过框架和中间件源码的优先考虑。这是因为一切秘密都藏在源码之中，阅读源码会让我们对框架或者中间件的理解更加深刻。有时候即使你阅读了大量原理性的文档，但如果不看源码，可能仍然会觉得还没有理解透。另外如果你能深入源码，招聘者从侧面也能感觉到你的学习热情和探索精神。

今天我们就来聊聊源码学习这个话题。对于Java后端开发来说，有不少经典的开源框架和中间件，下面我帮你按照后端的分层架构整理出来供你参考。

服务接入层：反向代理Nginx；API网关Node.js。
业务逻辑层：Web容器Tomcat、Jetty；应用层框架Spring、Spring MVC和Spring Boot；ORM框架MyBatis；
数据缓存层：内存数据库Redis；消息中间件Kafka。
数据存储层：关系型数据库MySQL；非关系型数据库MongoDB；文件存储HDFS；搜索分析引擎Elasticsearch。

这其中每一层都要支持水平扩展和高可用，比如业务层普遍采用微服务架构，微服务之间需要互相调用，于是就出现了RPC框架：Spring Cloud和Dubbo。

除此之外，还有两个非常重要的基础组件：Netty和ZooKeeper，其中Netty用于网络通信，ZooKeeper用于分布式协调。其实很多中间件都用到了这两个基础组件，并且ZooKeeper的网络通信模块也是通过Netty来实现的。

而这些框架或者中间件并不是凭空产生的，它们是在互联网的演化过程中，为了解决各种具体业务的痛点，一点一点积累进化而来的。很多时候我们把这些“零件”按照成熟的模式组装在一起，就能搭建出一个互联网后台系统。一般来说大厂都会对这些框架或者中间件进行改造，或者完全靠自己来实现。这就对后台程序员提出了更高的要求。

那这么多中间件和框架，从哪里入手呢？先学哪个后学哪个呢？我觉得可以先学一些你熟悉的，或者相对来说比较简单的，树立起信心后再学复杂的。比如可以先学Tomcat、Jetty和Spring核心容器，弄懂了这些以后再扩展到Spring的其他组件。

在这个过程中，我们就会积累一些通用的技术，比如网络编程、多线程、反射和类加载技术等，这些通用的技术在不少中间件和框架中会用到。

先说网络通信，在分布式环境下，信息要在各个实体之间流动，到处都是网络通信的场景，比如浏览器要将HTTP请求发给Web容器，一个微服务要调用另一个微服务，Web应用读写缓存服务器、消息队列或者数据库等，都需要网络通信。

尽管网络通信的场景很多，但无外乎都要考虑这么几个问题：

I/O模型同步还是异步，是阻塞还是非阻塞？
通信协议是二进制（gRPC）还是文本（HTTP）？
数据怎么序列化，是JSON还是Protocol Buffer？

此外服务端的线程模型也是一个重点。我们知道多线程可以把要做的事情“并行化”，提高并发度和吞吐量，但是线程可能会阻塞，一旦阻塞线程资源就闲置了，并且会有线程上下文切换的开销，浪费CPU资源。而有些任务执行会发生阻塞，有些则不会阻塞，因此线程模型就是要决定哪几件事情放到一个线程来做，哪几件事情放到另一个线程来做，并设置合理的线程数量，目的就是要让CPU忙起来，并且不是白忙活，也就是不做无用功。

我们知道服务端处理一个网络连接的过程是：

accept、select、read、decode、process、encode、send。

一般来说服务端程序有几个角色：Acceptor、Selector和Processor。

Acceptor负责接收新连接，也就是accept；
Selector负责检测连接上的I/O事件，也就是select；
Processor负责数据读写、编解码和业务处理，也就是read、decode、process、encode、send。

Acceptor在接收连接时，可能会阻塞，为了不耽误其他工作，一般跑在单独的线程里；而Selector在侦测I/O事件时也可能阻塞，但是它一次可以检测多个Channel（连接），其实就是用阻塞它一个来换取大量业务线程的不阻塞，那Selector检测I/O事件到了，是用同一个线程来执行Processor，还是另一个线程来执行呢？不同的场景又有相应的策略。

比如Netty通过EventLoop将Selector和Processor跑在同一个线程。一个EventLoop绑定了一个线程，并且持有一个Selector。而Processor的处理过程被封装成一个个任务，一个EventLoop负责处理多个Channel上的所有任务，而一个Channel只能由一个EventLoop来处理，这就保证了任务执行的线程安全，并且用同一个线程来侦测I/O事件和读写数据，可以充分利用CPU缓存。我们通过一张图来理解一下：

请你注意，这要求Processor中的任务能在短时间完成，否则会阻塞这个EventLoop上其他Channel的处理。因此在Netty中，可以设置业务处理和I/O处理的时间比率，超过这个比率则将任务扔到专门的业务线程池来执行，这一点跟Jetty的EatWhatYouKill线程策略有异曲同工之妙。

而Kafka把Selector和Processor跑在不同的线程里，因为Kafka的业务逻辑大多涉及与磁盘读写，处理时间不确定，所以Kafka有专门的业务处理线程池来运行Processor。与此类似，Tomcat也采用了这样的策略，同样我们还是通过一张图来理解一下。

我们再来看看Java反射机制，几乎所有的框架都用到了反射和类加载技术，这是为了保证框架的通用性，需要根据配置文件在运行时加载不同的类，并调用其方法。比如Web容器Tomcat和Jetty，通过反射来加载Servlet、Filter和Listener；而Spring的两大核心功能IOC和AOP，都用到了反射技术；再比如MyBatis将数据从数据库读出后，也是通过反射机制来创建Java对象并设置对象的值。

因此你会发现，通过学习一个中间件，熟悉了这些通用的技术以后，再学习其他的中间件或者框架就容易多了。比如学透了Tomcat的I/O线程模型以及高并发高性能设计思路，再学Netty的源码就轻车熟路了；Tomcat的组件化设计和类加载机制理解透彻了，再学Spring容器的源码就会轻松很多。

接下来我再来聊聊具体如何学习源码，有很多同学在专栏里问这个问题，我在专栏的留言中也提到过，但我觉得有必要展开详细讲讲我是如何学习源码的。

学习的第一步，首先我们要弄清楚中间件的核心功能是什么，我以专栏所讲的Tomcat为例。Tomcat的核心功能是HTTP服务器和Servlet容器，因此就抓住请求处理这条线：通过什么样的方式接收连接，接收到连接后以什么样的方式来读取数据，读到数据后怎么解析数据（HTTP协议），请求数据解析出来后怎么调用Servlet容器，Servlet容器又怎么调到Spring中的业务代码。

为了完成这些功能，Tomcat中有一些起骨架作用的核心类，其他类都是在这个骨架上进行扩展或补充细节来实现。因此在学习前期就要紧紧抓住这些类，先不要深入到其他细节，你可以先画出一张骨架类图。

在此之后，我们还需要将源码跑起来，打打断点，看看变量的值和调用栈。我建议用内嵌式的方式来启动和调试Tomcat，体会一下Spring Boot是如何使用Tomcat的，这里有示例源码。在源码阅读过程中要充分利用IDE的功能，比如通过快捷键查找某个接口的所有实现类、查找某个类或者函数在哪些地方被用到。

我们还要带着问题去学习源码，比如你想弄清楚Tomcat如何启停、类加载器是如何设计的、Spring Boot是如何启动Tomcat的、Jetty是如何通过Handler链实现高度定制化的，如果要你来设计这些功能会怎么做呢？带着这些问题去分析相关的源码效率会更高，同时你在寻找答案的过程中，也会碰到更多问题，等你把这些问题都弄清楚了，你获得的不仅仅是知识，更重要的是你会树立起攻克难关的信心。同时我还建议，在你弄清楚一些细节后要及时记录下来，画画流程图或者类图，再加上一些关键备注以防遗忘。

当然在这个过程中，你还可以看看产品的官方文档，熟悉一下大概的设计思路。在遇到难题时，你还可以看看网上的博客，参考一下别人的分析。但最终还是需要你自己去实践和摸索，因为网上的分析也不一定对，只有你自己看了源码后才能真正理解它，印象才更加深刻。

今天说了这么多，就是想告诉你如果理解透彻一两个中间件，有了一定的积累，这时再来学一个新的系统，往往你只需要瞧上几眼，就能明白它所用的架构，而且你会自然联想到系统存在哪些角色，以及角色之间的关系，包括静态的依赖关系和动态的协作关系，甚至你会不由自主带着审视的眼光，来发现一些可以改进的地方。如果你现在就是这样的状态，那么恭喜你，你的技术水平已经成长到一个新的层面了。

不知道今天的内容你消化得如何？如果还有疑问，请大胆的在留言区提问，也欢迎你把你的课后思考和心得记录下来，与我和其他同学一起讨论。如果你觉得今天有所收获，欢迎你把它分享给你的朋友。

精选留言

Dovelol

2019-06-09 21:33:02

老师好，想请教下tomcat中有个名叫Catalina-utility-xx线程作用是什么呢？能否讲下tomcat中各种线程池或者线程的作用？

作者回复

名字里带有Acceptor的线程负责接收浏览器的连接请求。

名字里带有Poller的线程，其实内部是个Selector，负责侦测IO事件。

名字里带有Catalina-exec的是工作线程，负责处理请求。

名字里带有 Catalina-utility的是Tomcat中的工具线程，主要是干杂活，比如在后台定期检查Session是否过期、定期检查Web应用是否更新（热部署热加载）、检查异步Servlet的连接是否过期等等。

2019-06-10 16:05:36
海水

2019-06-08 20:47:10

老师好，如果向spring controler里面的耗时避免不了，比如三方接口的耗时避免不了秒级的耗时，这样是不是要用异步servlet，耗时交给单独的线程池？但是我感觉这样即使用单独的线程池也是用的系统的级线程池，高并发的话是不是也解决不了问题？有没有办法换成协程来解决问题？但是spring 貌似又是线程级的，这种场景是不是改用go会好点？

作者回复

如果业务处理时间过长，阻塞大量Tomcat线程导致线程饥饿，可以考虑异步Servlet，这样Tomcat线程立即返回，耗时处理由业务线程来处理。

但业务线程同样有线程阻塞的问题，比如阻塞在IO上。基本思路都是用“异步回调”来避免阻塞，采用异步非阻塞IO模型，用少量线程通过事件循环来提高吞吐量。Spring给出的方案是Spring Webflux。Nodejs也是这样，适合IO密集型的应用。

协程也是这个思路，并且它的网络通信也是通过epoll来实现非阻塞的，只不过它向开发者提供了“同步阻塞”式的API，另外协程的上下文切换开销也比线程小，因为它将“函数调用上下文”保存在应用层面，内核感觉不到，但是这需要额外的内存、调度和管理开销。

2019-06-09 11:00:14
-W.LI-

2019-06-08 12:07:35

谢谢老师!少走好多弯路
Monday

2019-06-08 23:15:54

个人感觉，学习知识能问出高质量问题非常重要，感谢老师的问题和源码学习路线。🙏🙏🙏
Vincent

2019-07-09 20:05:39

老师好，"包括静态的依赖关系和动态的协作关系" 能通过Tomcat 具体讲解下吗

作者回复

Connector组件中持有ProtocolHandler和Processor实例，这算是静态的依赖关系；而Connector将请求解析出来后交给Container处理，这是动态的协作关系。说的有点咬文嚼字：）

2019-07-15 18:55:21
Dovelol

2019-06-11 15:04:07

老师好，之前请教了tomcat中的几种线程，有个小问题是，我在controller中调用Thread.currentThread()发现有些项目（可能是不同项目或者不同运行环境）确实是Catalina-exec在处理请求，但是有些名称是Thread-1，Thread-2这种线程在处理，区别在哪呢，是不是哪个地方配置不同的原因？

作者回复

默认情况下是一个Connector一个线程池，你还可以在server.xml中配置一个全局线程池，还可以指定线程名字的前缀：

<Service name="Catalina">



2019-06-11 21:47:34
发条橙子。

2019-06-09 10:27:05

老师，那你的意思是不是，其实现在已经把tomcat的整体架构讲完了。我们可以先试着自己去读源码了？

作者回复

对的尤其是接下来的文章会深入细节，我会贴出关键代码和分析，但课后最好也去读读相关源码。

2019-06-09 11:03:39
Dovelol

2019-06-11 16:17:42

老师好，请教下，在看tomcat接收请求的源码时发现org.apache.coyote.Request在AbstractProcessor类中是一个成员变量，并且AbstractProcessor的实现类Http11AprProtocol是由recycledProcessors.pop()产生的，那所有请求岂不是公用一个Http11AprProtocol对象，那并发请求的时候Request对象的属性到底是哪个请求数据的呢，感觉Request对象应该是线程绑定的才对，但是没有找到绑定的地方。

作者回复

一个请求到来，Tomcat会创建一个SocketProccessor，这是个runnable，会被扔到线程池执行。

在执行过程中，会创建一个Request对象，一个Response对象，和一个Http11Processor对象（AbstractProcessor的子类）。
一次请求处理完了，这些对象会被回收保存起来，重复使用（对象池技术）。

建议看第14篇，有详细过程。

2019-06-11 20:53:04
ty_young

2019-06-08 11:38:22

老师，您说的服务端线程模型就是Proactor和Reactor么

作者回复

对的

2019-06-08 14:12:06
唐木儿

2019-06-17 19:36:55

老师，我下载了Tomcat源码后，用Ant编译后，显示"程序包org.apache.tools.Ant不存在"，是怎么回事呢？直接通过CMD，键入"ant"，提示的是BUILD SUCCESS！这表示已经编译过了吧？但是一运行就显示上面的提示"程序包org.apache.tools.Ant不存在"

作者回复

建议还是不要折腾Ant编译了，直接用内嵌式方式启动和调试。

2019-06-21 20:12:24
imsunv

2019-06-10 09:24:43

老师关于网络通信的总结很棒，很多东西都是知道些，但是不能很好的总结下来
QQ怪

2019-06-08 16:30:33

谢谢老师分享
尹兆发

2019-06-08 09:50:08

老师辛苦了
旷野之希

2024-03-14 08:05:20

讲得特别好，感谢。
| ~浑蛋~

2022-07-05 21:34:48

请问调用request.startAsync()方法的作用是啥？之后的逻辑由哪个线程来处理？
青苹果

2022-01-25 13:43:28

老师您好，请问什么是真正学懂了一个框架的源码呢？有什么标准吗，我的意思是，学习源码要到什么程度我们可以说，这个框架的源码我算看过了，看懂了，可以看下一个了呢？
单俊宁

2020-03-29 15:21:41

老师给的思路很好，但我去看源码的时候总是理不出线路来，导致看了源码跟没看一样
阴建锋

2020-01-22 17:44:30

老师使用tomcat线程池最小设置100 最大设置1000 问题:观察线程数(如 300多)一直在增加没有释放什么原因(看线程有好多是空闲(100多空闲的))
苏忆

2019-09-27 08:43:32

谢谢老师
仙道

2019-07-09 11:22:18

能不能教下怎么把tomcat源码导入idea啊