05 | 大类：如何避免写出难以理解的大类？

你好，我是郑晔。

上一讲我们讲了长函数，一个让你感受最直观的坏味道。这一讲，我们再来讲一个你一听名字就知道是怎么回事的坏味道：大类。

一听到大类，估计你的眼前已经浮现出一片无边无际的代码了。类之所以成为了大类，一种表现形式就是我们上节课讲到的长函数，一个类只要有几个长函数，那它就肯定是一眼望不到边了（长函数的话题，我们上一讲已经讨论过了，这里就不再赘述了）。

大类还有一种表现形式，类里面有特别多的字段和函数，也许，每个函数都不大，但架不住数量众多啊，这也足以让这个类在大类中占有一席之地。这一讲，我们就主要来说说这种形式的大类。

分模块的程序

我先来问你一个问题，为什么不把所有的代码都写到一个文件里？

你可能会觉得这个问题很傻，心里想：除了像练习之类的特定场景，谁会在一个正经的项目上把代码写到一个文件里啊？

没错，确实没有人这么做，但你思考过原因吗？把代码都写到一个文件里，问题在哪里呢？

事实是，把代码写到一个文件里，一方面，相同的功能模块没有办法复用；另一方面，也是更关键的，把代码都写到一个文件里，其复杂度会超出一个人能够掌握的认知范围。简言之，一个人理解的东西是有限的，没有人能同时面对所有细节。

人类面对复杂事物给出的解决方案是分而治之。所以，我们看到几乎各种程序设计语言都有自己的模块划分方案，从最初的按照文件划分，到后来，使用面向对象方案按照类进行划分，本质上，它们都是一种模块划分的方式。这样，人们面对的就不再是细节，而是模块，模块的数量显然会比细节数量少，人们的理解成本就降低了。

好，你现在已经理解了，对程序进行模块划分，本质上就是在把问题进行分解，而这种做法的背后原因，就是人类的认知能力是有限的。

理解了这一点，我们再回过头来看大类这个坏味道，你就知道问题出在哪了。如果一个类里面的内容太多，它就会超过一个人的理解范畴，顾此失彼就在所难免了。

按照这个思路，解决大类的方法也就随之而来了，就是把大类拆成若干个小类。你可能会想，这我也知道，问题是，怎么拆呢？

大类的产生

想要理解怎么拆分一个大类，我们需要知道，这些类是怎么变成这么大的。

职责不单一

最容易产生大类的原因在于职责的不单一。我们先来看一段代码：

public class User {
  private long userId;
  private String name;
  private String nickname;
  private String email;
  private String phoneNumber;
  private AuthorType authorType;
  private ReviewStatus authorReviewStatus;
  private EditorType editorType;
  ...
}

这个 User 类拥有着一个大类的典型特征，其中包含着一大堆的字段。面对这样一个类时，我们要问的第一个问题就是，这个类里的字段都是必需的吗？

我们来稍微仔细地看一下这个类，用户 ID（userId）、姓名（name）、昵称（nickname）之类应该是一个用户的基本信息，后面的邮箱（email）、电话号码（phoneNumber）也算是和用户相关联的。今天的很多应用都提供使用邮箱或电话号码登录的方式，所以，这个信息放在这里，也算是可以理解。

再往后看，作者类型（authorType），这里表示作者是签约作者还是普通作者，签约作者可以设置作品的付费信息，而普通作者不能。后面的字段是作者审核状态（authorReviewStatus），就是说，作者成为签约作者，需要有一个申请审核的过程，这个状态就是审核的状态。

再往后，又出现了一个编辑类型（editorType），编辑可以是主编，也可以是小编，他们的权限是不一样的。

这还不是这个 User 类的全部。但是，即便只看这些内容，也足以让我们发现一些问题了。

首先，普通的用户既不是作者，也不是编辑。作者和编辑这些相关的字段，对普通用户来说，都是没有意义的。其次，对于那些成为了作者的用户，编辑的信息意义也不大，因为作者是不能成为编辑的，反之亦然，编辑也不会成为作者，作者信息对成为编辑的用户也是没有意义的。

在这个类的设计里面，总有一些信息对一部分人是没有意义，但这些信息对于另一部分人来说又是必需的。之所以会出现这样的状况，关键点就在于，这里只有“一个”用户类。

普通用户、作者、编辑，这是三种不同角色，来自不同诉求的业务方关心的是不同的内容。只是因为它们都是这个系统的用户，就把它们都放到用户类里，造成的结果就是，任何业务方的需求变动，都会让这个类反复修改。这种做法实际上是违反了单一职责原则。

在《软件设计之美》中，我曾经专门用了一讲的篇幅讲单一职责原则，它让我们把模块的变化纳入考量。单一职责原则是衡量软件设计好坏的一把简单而有效的尺子，通常来说，很多类之所以巨大，大部分原因都是违反了单一职责原则。而想要破解“大类”的谜题，关键就是能够把不同的职责拆分开来。

回到我们这个类上，其实，我们前面已经分析了，虽然这是一个类，但其实，它把不同角色关心的东西都放在了一起，所以，它变得如此庞大。我们只要把不同的信息拆分开来，问题也就迎刃而解了。下面就是把不同角色拆分出来的结果：

public class User {
  private long userId;
  private String name;
  private String nickname;
  private String email;
  private String phoneNumber;
  ...
}

public class Author {
  private long userId;
  private AuthorType authorType;
  private ReviewStatus authorReviewStatus;
  ...
}

public class Editor {
  private long userId;
  private EditorType editorType;
  ...
}

这里，我们拆分出了 Author 和 Editor 两个类，把与作者和编辑相关的字段分别移到了这两个类里面。在这两个类里面分别有一个 userId 字段，用以识别这个角色是和哪个用户相关。这个大 User 类就这样被分解了。

字段未分组

大类的产生往往还有一个常见的原因，就是字段未分组。

有时候，我们会觉得有一些字段确实都是属于某个类，结果就是，这个类还是很大。比如，我们看一下上面拆分的结果，那个新的 User 类：

public class User {
  private long userId;
  private String name;
  private String nickname;
  private String email;
  private String phoneNumber;
  ...
}

前面我们分析过，这些字段应该都算用户信息的一部分。但是，即便相比于原来的 User 类小了许多，这个类依然也不算是一个小类，原因就是，这个类里面的字段并不属于同一种类型的信息。比如，userId、name、nickname 几项，算是用户的基本信息，而 email、phoneNumber 这些则属于用户的联系方式。

从需求上看，基本信息是那种一旦确定就不怎么会改变的内容，而联系方式则会根据实际情况调整，比如，绑定各种社交媒体的账号。所以，如果我们把这些信息都放到一个类里面，这个类的稳定程度就要差一些。所以，我们可以根据这个理解，把 User 类的字段分个组，把不同的信息放到不同的类里面。

public class User {
  private long userId;
  private String name;
  private String nickname;
  private Contact contact;
  ...
}

public class Contact {
  private String email;
  private String phoneNumber;
  ...
}

这里我们引入了一个 Contact 类（也就是联系方式），把 email 和 phoneNumber 放了进去，后面再有任何关于联系方式的调整就都可以放在这个类里面。经过这次调整，我们把不同的信息重新组合了一下，但每个类都比原来要小。

对比一下，如果说前后两次拆分有什么不同，那就是：前面是根据职责，拆分出了不同的实体，后面是将字段做了分组，用类把不同的信息分别做了封装。

或许你已经发现了，所谓的将大类拆解成小类，本质上在做的工作是一个设计工作。我们分解的依据其实是单一职责这个重要的设计原则。没错，很多人写代码写不好，其实是缺乏软件设计的功底，不能有效地把各种模型识别出来。所以，想要写好代码，还是要好好学学软件设计的。

学了这一讲，如果你还想有些极致的追求，我给你推荐《ThoughtWorks文集》这本书里“对象健身操”这一篇，这里提到一个要求：每个类不超过 2 个字段。《ThoughtWorks文集》是我当年参与翻译的一本书，今天看来，里面的内容大部分都过时了，但“对象健身操”这一篇还是值得一读的。

关于大类的讨论差不多就接近尾声了，但我估计结合这一讲最初的讨论，有些人心中会升起一些疑问：如果我们把大类都拆成小类，类的数量就会增多，那人们理解的成本是不是也会增加呢？

其实，这也是很多人不拆分大类的借口。

在这个问题上，程序设计语言早就已经有了很好的解决方案，所以，我们会看到在各种程序设计语言中，有诸如包、命名空间之类的机制，将各种类组合在一起。在你不需要展开细节时，面对的是一个类的集合。再进一步，还有各种程序库把这些打包出来的东西再进一步打包，让我们只要面对简单的接口，而不必关心各种细节。

如此层层封装，软件不就是这样构建出来的吗？

总结时刻

我们今天讲了大类这个坏味道，这是程序员日常感知最为深刻的坏味道之一。

应对大类的解决方案，主要是将大类拆分成小类。我们需要认识到，模块拆分，本质上是帮助人们降低理解成本的一种方式。

我们还介绍了两种产生大类的原因：

职责不单一；
字段未分组。

无论是哪种原因，想要有效地对类进行拆分，我们需要对不同内容的变动原因进行分析，而支撑我们来做这种分析的就是单一职责原则。将大类拆分成小类，本质上在做的是设计工作，所以，想要写好代码，程序员需要学好软件设计。

有人觉得拆分出来的小类过多，不易管理，但其实程序设计语言早就为我们提供了各种构造类集合的方式，比如包、命名空间等，再进一步，还可以封装出各种程序库。

如果今天的内容你只能记住一件事，那请记住：把类写小，越小越好。

思考题

你在实际工作中遇到过多大的类，你分析过它是怎样产生的吗？又是如何拆分的呢？欢迎在留言区分享你的经历。如果你身边有同事总是写出大类，你不妨把这节课分享给他，帮他解决大类的烦恼。

感谢阅读，我们下一讲再见！

参考资料：

单一职责原则：你的模块到底为谁负责？

你的代码是怎么变混乱的？

精选留言

qinsi

2021-01-09 10:45:51

正如类太大会超出人的理解范畴，类太多也会。举个java的例子，做业务开发时大部分需求都可以通过spring boot完成，但如果要对spring进行定制，需要理解的内容就多了一个数量级。框架本身在满足更多需求的同时不断重构，类的职责越来越单一，数量也越来越多。虽然每个改动都有正当的理由，但如果不知道这些改动的历史，一下子就被那么多类糊一脸，任谁也是吃不消的。个人理解这可能是在业务优先的场景下，两害相权取其轻的结果吧。

作者回复

认为类太多是个问题，我在文章中已经说了一个角度，这里再补充一个角度。这里有一个假设是，一上来就要把所有的类理解掉，

然而，这种假设是不成立的，作为 Java 程序员，你不会去看所有 JDK 里的类，也不会看 Spring 所有的类。

一般的做法是理解主线，然后，根据需要了解相应的类，
这是做事方法的问题。不能因为我们可能要面对所有代码，就一下子去吃透所有的代码，这是普通人做不到的。

所以，类的数量多少不是问题，通过怎样的方式，降低代码理解的难度才是我们要考虑的问题。

2021-01-09 20:26:21
wang_acmilan

2021-01-09 22:26:12

目前在做嵌入式的项目，里面的C代码如郑老师所言，大部分都是以“效率”为名，写的巨长无比。
我有一个问题想咨询郑老师，我们的项目不算法，4万行左右，我在进行一代往二代的重构，我个人感觉应该把功能都拆开，以不同文件夹的层级方式进行代码的整理；而组内的同事以及外包的员工觉得代码不算多，一个文件夹，几个文件一把就搞定了，没必要搞那么复杂。

这个问题就和老师这篇文章所述有一点不一样了：如果觉得代码架构和代码逻辑能够理解，是不是clean code的必要性或者说急迫性就没有那么大了。先以交付为目标进行coding，后续再看情况。

作者回复

马斯洛需求层次理论告诉我们，人有不同层次的追求。生存是底线，总有人会告诉你，温饱解决就行。

写代码也一样，功能实现就可以了，代码规模不大，可以理解。问题在于，等规模大了，你真的改得动吗？

你的代码为什么要改动？还不是一代的代码改起来很吃力了。为什么吃力了？是因为功能实现不了吗？还不是代码可维护性差。为什么可维护性差？还不是根本不知道可维护性好的代码是什么样。

你不妨推演一下，按照他们的建议写代码，距离走回老路上，还有多远的距离。

既然有机会建立新的标准，既然有机会知道可维护的代码长什么样，为什么要按照老路走呢？

如果知道什么是“积重难返”，就会懂得“勿以善小而不为”的价值所在了。

2021-01-10 08:23:54
邓志国

2021-01-11 17:43:20

看了郑大的例子，正合我当前做法，给自己吃颗定心丸。我现在java一个4万行代码的项目，最大的类不到300行代码。普遍100行以下。很多是得益于对象健身操。操练了对象健身操，对面向对象会有更深刻理解

作者回复

你做得已经很好了！

2021-01-12 21:12:11
布凡

2021-02-09 15:09:33

老师，请问一下，一般来说实体的大小和数据表的列是对应关系的，User类拆分出了Contact这个类，那么数据库的层面是否也应该差分出一个Contact表还是把信息都存储在User表的列中呢？

作者回复

都可以，根据自己的需要。很多人纠结的点在于没做过“类分开，表在一起”，其实，很多框架是支持的。

2021-02-09 20:10:16
life吖

2021-01-11 15:21:47

有的时候，拆分和聚合是需要做取舍的。比如，微服务的聚合层，是为了适配和性能考虑会做裁剪或聚合，不可避免的会出现些大类，此时可以进行字段分组，但是聚合后的大类是无法进行拆分。

作者回复

我的理解，你问的问题是，在微服务中，有专门把多个服务的结果聚合起来，返回给客户端，这是你所说的聚合层。你的问题是，在这个聚合层里，表示请求和应答的类可能会比较大，改怎么办。

根据这个理解，我的回答是，这里的聚合层扮演的角色其实一个防腐层，它本身的职责就是和请求应答去做一一应对。一般来说，这样类行为很单一，主要的职责就是数据转换。对于这种类，大一点是可以的，因为它不会对业务造成什么影响。重点在于，这个类里没有业务。

如果你想把类里面的字段做一个分组，可以研究一下不同的转换库，比如，在 Java 中把 JSON 和对象进行相互转换的 Jackson。看看它们怎么可以把不同类的字段和协议中的平铺字段直接映射，肯定有方案的。

不过，最后要提醒你的一个重点是，简单的聚合并不是一个好办法，而是需要谨慎地设计通信协议，这才是保证类比较小的根本办法。

2021-01-16 16:46:55
Hobo

2021-01-11 22:39:54

将user里的联系信息单独拆出一个类来以后，我要对外暴露一个修改联系信息的方法是应该放user里还是放contact里？

作者回复

如果 user 类是整个的根，修改联系方式就可以在 user 类里提供一个入口，然后，再调用 contact 类。

2021-01-14 09:41:08
明

2021-01-11 19:54:13

老师，我也有个一直找不到平衡点的问题，就是类爆炸问题，如果拆分的类太多会不会出现累爆炸的问题呢，从而影响系统性能，这个有没有个比较数字化的标准呢。还是我看这个问题的角度就完全不对。（ps 拍个马屁：我真的越来越崇拜老师了😍😍）

作者回复

不要把性能放在这里说事，因为这属于发力找错了对象。性能优化肯定不是在这个层面上的，而是要从一个系统的层面上进行考量。

类爆炸，首先是，啥叫类爆炸？类多就是类爆炸吗？那岂不是所有代码都在一个类里完成就是最好的。类多不是问题，问题是过度设计造成的难以理解的结构才是问题。

2021-01-24 10:08:27
人月聊IT

2021-01-09 14:01:59

每个类两个字段？？？？

作者回复

我知道大多数人做不到，但我们应该知道更高的追求是什么。

2021-01-09 20:14:27
熊斌

2021-01-09 13:44:39

我们的项目中，或者是用到的类似于JPUSH这种开源软件中，都存在“大类”的问题。最头疼的是遇见没有注释说明的大类，里面罗列了很多字段、函数，但是你都没法一眼就看出来各自都是干嘛的，只能先猜一下，完了之后根据调用关系去梳理。

最近用PHP进行二次开发，用到一个扩展包，里面的入口class写得巨长无比......

目前来看，把类写小，越小越好能做到的是凤毛麟角呀。也可能是我见得太少了

作者回复

不意外，大多数代码都是有问题的，Clean Code是稀缺的。

2021-01-09 20:40:46
小袁

2022-05-03 17:15:14

一个类不超过两个字段？典型的从一个极端走到另外一个极端！
Sinvi

2021-01-09 22:49:25

今天有了新的追求

作者回复

加油！

2021-01-10 08:24:01
芒果少侠

2021-10-16 03:09:45

老师，字段分组后，在做序列化反序列化（如json）的时候，就会多产生一个嵌套层级（由a.b变成了a.c.b）这样可能会破坏一些上下游服务的交互协议

作者回复

你这个论点是前提条件是，传输的对象和领域的对象是一致的，而这恰恰是我反对的。如果需要与上下游通信，那就设计一个专门的传输对象好了。

另外，传输对象和传输格式之间的映射都是可以定义的，我们不应该陷入到默认的模式里。

2021-10-17 09:59:32
Hobo

2021-01-11 22:36:58

我们项目实体类和数据库表是直接映射的，如果拆分成上面这样的话，数据库是也需要拆多表？(用户、作者、编辑)

作者回复

这是设计怎么与实现映射的事，通常来说，应该把实现拆分成多个表。

2021-01-14 09:39:53
邵俊达

2021-08-22 12:29:40

郑老师您好，「对象健身操」中有一条规则是「封装所有的原生类型和字符串」，请问这些封装好的对象在项目中一般放在什么目录下比较合适？

作者回复

这就看你封装出来的概念到底是什么了，比如说，如果封装的是参数，就放到与相应函数在一起的包里，如果封装出来的是一个实体的概念，那就放到实体包里。

2021-08-22 19:18:46
大碗

2021-01-12 17:19:07

MVC里常出现的大类是UserService,提供登陆，注册，修改密码，查询用户等方法里面会有UserDao,LoginRecordDao，CacheDao等很多个注入的“字段”。这种应该怎么拆分呢，如果按职责拆分成UserLoginService,UserRegisterService,UserPasswordService,UserInfoService，保持每个service里面又少量注入“Service、Dao”，这么拆对不对呢

作者回复

我现在通常的做法是，引入应用服务层，在应用服务层去协调各个领域服务层。而在领域服务层，一个服务通常只对应一个数据库访问层的代码。

你这里的纠结其实就是缺少了应用服务层。如果不引入应用服务层，可以考虑的做法是，服务层内部可以引用，但服务只对应一个数据库访问层代码。

2021-01-14 08:15:04
Jxin

2021-01-12 09:47:57

1.总结：小类大对象+面相意图的抽象。

2.好的抽象只需关心使用不用关心实现，所以能降低复杂性。但不好的抽象。。。

3.个人觉得还是讲究平衡，没必要一上来就拆分得很细致。当复杂度让你皱眉头时再拆也许更物有所值。

作者回复

看一下我在开篇词中提供的自查表，那里面的括号就是你要根据自己团队的实际情况填写的内容。

2021-01-12 14:53:02
刘大明

2021-01-09 17:43:13

现在项目中很多大类，把很多东西都返回前端。美其名曰这样前端想怎么用怎么用。还有就是拆分成多个小类之后，很多人没有管理好小类的能力。分散的越来越复杂。

作者回复

唉，用加班代替思考。

2021-01-14 08:29:43
王展鹏

2022-09-11 11:24:54

目前做前端工作，采用vue的单文件组件模式进行开发。由于业务场景的原因，之前采用1000行作为组件的最大长度，现在看来设置得大了。但是前端的交互、状态、展示会比较多，可能做不到100行以内。
行者

2022-05-31 17:28:14

提了很不专业的问题，拆分成多个小类，怎么用呢？用一个基础类来继承多个小类么？
李叶

2021-03-29 07:44:32

分而治之单一职责字段分组分离变化将类设计了小类，不超出可控范围