你好,我是欧创新。今天我们来学习聚合(Aggregate)和聚合根(AggregateRoot)。
我们先回顾下上一讲,在事件风暴中,我们会根据一些业务操作和行为找出实体(Entity)或值对象(ValueObject),进而将业务关联紧密的实体和值对象进行组合,构成聚合,再根据业务语义将多个聚合划定到同一个限界上下文(Bounded Context)中,并在限界上下文内完成领域建模。
那你知道为什么要在限界上下文和实体之间增加聚合和聚合根这两个概念吗?它们的作用是什么?怎么设计聚合?这就是我们这一讲重点要关注的问题。
聚合
在DDD中,实体和值对象是很基础的领域对象。实体一般对应业务对象,它具有业务属性和业务行为;而值对象主要是属性集合,对实体的状态和特征进行描述。但实体和值对象都只是个体化的对象,它们的行为表现出来的是个体的能力。
那聚合在其中起什么作用呢?
举个例子。社会是由一个个的个体组成的,象征着我们每一个人。随着社会的发展,慢慢出现了社团、机构、部门等组织,我们开始从个人变成了组织的一员,大家可以协同一致的工作,朝着一个最大的目标前进,发挥出更大的力量。
领域模型内的实体和值对象就好比个体,而能让实体和值对象协同工作的组织就是聚合,它用来确保这些领域对象在实现共同的业务逻辑时,能保证数据的一致性。
你可以这么理解,聚合就是由业务和逻辑紧密关联的实体和值对象组合而成的,聚合是数据修改和持久化的基本单元,每一个聚合对应一个仓储,实现数据的持久化。
聚合有一个聚合根和上下文边界,这个边界根据业务单一职责和高内聚原则,定义了聚合内部应该包含哪些实体和值对象,而聚合之间的边界是松耦合的。按照这种方式设计出来的微服务很自然就是“高内聚、低耦合”的。
聚合在DDD分层架构里属于领域层,领域层包含了多个聚合,共同实现核心业务逻辑。聚合内实体以充血模型实现个体业务能力,以及业务逻辑的高内聚。跨多个实体的业务逻辑通过领域服务来实现,跨多个聚合的业务逻辑通过应用服务来实现。比如有的业务场景需要同一个聚合的A和B两个实体来共同完成,我们就可以将这段业务逻辑用领域服务来实现;而有的业务逻辑需要聚合C和聚合D中的两个服务共同完成,这时你就可以用应用服务来组合这两个服务。
聚合根
聚合根的主要目的是为了避免由于复杂数据模型缺少统一的业务规则控制,而导致聚合、实体之间数据不一致性的问题。
传统数据模型中的每一个实体都是对等的,如果任由实体进行无控制地调用和数据修改,很可能会导致实体之间数据逻辑的不一致。而如果采用锁的方式则会增加软件的复杂度,也会降低系统的性能。
如果把聚合比作组织,那聚合根就是这个组织的负责人。聚合根也称为根实体,它不仅是实体,还是聚合的管理者。
首先它作为实体本身,拥有实体的属性和业务行为,实现自身的业务逻辑。
其次它作为聚合的管理者,在聚合内部负责协调实体和值对象按照固定的业务规则协同完成共同的业务逻辑。
最后在聚合之间,它还是聚合对外的接口人,以聚合根ID关联的方式接受外部任务和请求,在上下文内实现聚合之间的业务协同。也就是说,聚合之间通过聚合根ID关联引用,如果需要访问其它聚合的实体,就要先访问聚合根,再导航到聚合内部实体,外部对象不能直接访问聚合内实体。
怎样设计聚合?
DDD领域建模通常采用事件风暴,它通常采用用例分析、场景分析和用户旅程分析等方法,通过头脑风暴列出所有可能的业务行为和事件,然后找出产生这些行为的领域对象,并梳理领域对象之间的关系,找出聚合根,找出与聚合根业务紧密关联的实体和值对象,再将聚合根、实体和值对象组合,构建聚合。
下面我们以保险的投保业务场景为例,看一下聚合的构建过程主要都包括哪些步骤。

第 1 步:采用事件风暴,根据业务行为,梳理出在投保过程中发生这些行为的所有的实体和值对象,比如投保单、标的、客户、被保人等等。
第 2 步:从众多实体中选出适合作为对象管理者的根实体,也就是聚合根。判断一个实体是否是聚合根,你可以结合以下场景分析:是否有独立的生命周期?是否有全局唯一ID?是否可以创建或修改其它对象?是否有专门的模块来管这个实体。图中的聚合根分别是投保单和客户实体。
第 3 步:根据业务单一职责和高内聚原则,找出与聚合根关联的所有紧密依赖的实体和值对象。构建出 1 个包含聚合根(唯一)、多个实体和值对象的对象集合,这个集合就是聚合。在图中我们构建了客户和投保这两个聚合。
第 4 步:在聚合内根据聚合根、实体和值对象的依赖关系,画出对象的引用和依赖模型。这里我需要说明一下:投保人和被保人的数据,是通过关联客户ID从客户聚合中获取的,在投保聚合里它们是投保单的值对象,这些值对象的数据是客户的冗余数据,即使未来客户聚合的数据发生了变更,也不会影响投保单的值对象数据。从图中我们还可以看出实体之间的引用关系,比如在投保聚合里投保单聚合根引用了报价单实体,报价单实体则引用了报价规则子实体。
第 5 步:多个聚合根据业务语义和上下文一起划分到同一个限界上下文内。
这就是一个聚合诞生的完整过程了。
聚合的一些设计原则
我们不妨先看一下《实现领域驱动设计》一书中对聚合设计原则的描述,原文是有点不太好理解的,我来给你解释一下。
1. 在一致性边界内建模真正的不变条件。聚合用来封装真正的不变性,而不是简单地将对象组合在一起。聚合内有一套不变的业务规则,各实体和值对象按照统一的业务规则运行,实现对象数据的一致性,边界之外的任何东西都与该聚合无关,这就是聚合能实现业务高内聚的原因。
2. 设计小聚合。如果聚合设计得过大,聚合会因为包含过多的实体,导致实体之间的管理过于复杂,高频操作时会出现并发冲突或者数据库锁,最终导致系统可用性变差。而小聚合设计则可以降低由于业务过大导致聚合重构的可能性,让领域模型更能适应业务的变化。
3. 通过唯一标识引用其它聚合。聚合之间是通过关联外部聚合根ID的方式引用,而不是直接对象引用的方式。外部聚合的对象放在聚合边界内管理,容易导致聚合的边界不清晰,也会增加聚合之间的耦合度。
4. 在边界之外使用最终一致性。聚合内数据强一致性,而聚合之间数据最终一致性。在一次事务中,最多只能更改一个聚合的状态。如果一次业务操作涉及多个聚合状态的更改,应采用领域事件的方式异步修改相关的聚合,实现聚合之间的解耦(相关内容我会在领域事件部分详解)。
5. 通过应用层实现跨聚合的服务调用。为实现微服务内聚合之间的解耦,以及未来以聚合为单位的微服务组合和拆分,应避免跨聚合的领域服务调用和跨聚合的数据库表关联。
上面的这些原则是DDD的一些通用的设计原则,还是那句话:“适合自己的才是最好的。”在系统设计过程时,你一定要考虑项目的具体情况,如果面临使用的便利性、高性能要求、技术能力缺失和全局事务管理等影响因素,这些原则也并不是不能突破的,总之一切以解决实际问题为出发点。
总结
[第04讲] 和 [第05讲] 的内容,其实是有强关联的。我们不妨在这里总结下聚合、聚合根、实体和值对象它们之间的联系和区别。
聚合的特点:高内聚、低耦合,它是领域模型中最底层的边界,可以作为拆分微服务的最小单位,但我不建议你对微服务过度拆分。但在对性能有极致要求的场景中,聚合可以独立作为一个微服务,以满足版本的高频发布和极致的弹性伸缩能力。
一个微服务可以包含多个聚合,聚合之间的边界是微服务内天然的逻辑边界。有了这个逻辑边界,在微服务架构演进时就可以以聚合为单位进行拆分和组合了,微服务的架构演进也就不再是一件难事了。
聚合根的特点:聚合根是实体,有实体的特点,具有全局唯一标识,有独立的生命周期。一个聚合只有一个聚合根,聚合根在聚合内对实体和值对象采用直接对象引用的方式进行组织和协调,聚合根与聚合根之间通过ID关联的方式实现聚合之间的协同。
实体的特点:有ID标识,通过ID判断相等性,ID在聚合内唯一即可。状态可变,它依附于聚合根,其生命周期由聚合根管理。实体一般会持久化,但与数据库持久化对象不一定是一对一的关系。实体可以引用聚合内的聚合根、实体和值对象。
值对象的特点:无ID,不可变,无生命周期,用完即扔。值对象之间通过属性值判断相等性。它的核心本质是值,是一组概念完整的属性组成的集合,用于描述实体的状态和特征。值对象尽量只引用值对象。
思考题
请你结合公司的某个业务场景,试试能分析出哪些聚合?
欢迎留言和我分享你的思考,你也可以把今天所学分享给身边的朋友,邀请他加入探讨,共同进阶。

精选留言
2019-10-23 19:23:34
场景:电销
根据任务类型的属性创建具体的定期执行任务,调度器把到点的任务放到执行器里去执行。执行完了等待下一次执行,对任务生成的明细可以填写沟通记录(第三方服务)但是本服务要提供此字段查询
过程中记录统计日志。每个任务类型在查询他的任务时查询和列表展示字段集合都不一样
任务执行过程:从数据源获取数据 -> 根据任务配置的过滤规则过滤 -> 生成任务明细(有过期时间) -> 1.自动分配给销售/2.销售主动去领单,过程中生成任务执行日志,统计日志
领域对象:任务类型、任务、任务明细、日志、过滤规则、字段、销售、
聚合A:聚合根-任务,任务明细-实体,值对象:日志、任务类型、销售
聚合B:聚合根-过滤规则,
聚合C:聚合根-字段,值对象,展示字段属性定义集合、查询字段属性定义集合
问题:
1.一个聚合中,允不允许只有一个实体和一些属性值?
2.是否合理?不合理该怎么设计呢?
3.任务是根据任务类型创建出来的,聚合A是不是不合理?或者实体的初始化可不可以依赖它的值对象呢?
4.任务类型决定它可以进行哪些过滤,实际创建任务时才会真正选择使用哪些过滤规则,过滤规则算什么呢?能作为一个独立的聚合吗?
5.字段也是同样的,并且字段是没有一个生命周期的,这种情况下是不是作为值对象更合理? 但是聚合A和B都用到了字段,值对象能在多个聚合公用吗?
2019-10-31 00:26:29
2019-10-29 10:40:39
其次,我有3个疑问,
1. 聚合中可能会有实体,那允不允许直接把实体类型作为属性的类型或返回值暴露给外界?
2. 如果允许,那外界就可以直接获取其中的实体,然后调用者可以直接使用实体中的一些相关方法?这样似乎就违反了聚合很的设计?
3. 如果不允许,那外界如果需要得到某个实体的数据,要怎么操作?封装成 DTO 吗?
比如: Aggregate a 中包含一个b属性,b是一个实体。b 中包含操作该实体的方法 M。那外界调用a.b 就会直接获取到 b 这个实体,然后可以直接调用 M 方法。
2019-10-24 20:27:51
2019-10-23 18:54:44
2019-10-23 09:13:46
2019-11-06 18:38:44
我们的场景是:商家后台上,商家可以进行门店管理,收银pos机相关的设置,营业相关的设置
背景:商家后台已经存在,且商家基础系统、门店基础信息、pos相关信息,数据模型已经存在,各调用方是直接访问数据库的
目标:将商家、门店的基础信息,经营设置信息,抽象出来形成商家域 统一对外提供能力
想通过DDD的思想来进行建模,感觉无从下手,麻烦老师提供点思路
2019-10-29 19:45:10
其次它作为聚合的管理者,在聚合内部负责协调实体和值对象按照固定的业务规则协同完成共同的业务逻辑。
怎么感觉 聚合根做的事情和领域服务一样?
2020-08-14 15:08:27
比如:
用户聚合根和课程聚合根。
用户收藏了一门课程,收藏这个操作关联了用户和课程,同时生成了一条收藏记录。
那么收藏记录是值对象还是实体,应该归于哪个聚合根?
如果作为实体,它似乎不需要ID去标识,因为一个用户ID,一个课程ID就可以标识这样一条记录。
如果作为值对象,又感觉不合适,因为我的感觉(仅仅是感觉)多值的值对象不应该能无限增长,但收藏这个操作是不可能限制数量的。
2019-10-23 13:56:12
2020-08-26 09:18:29
既然聚合和聚合根都是实体且具有全局唯一ID,那么聚合和聚合根应该在代码层放置在domain的entity目录下,且应该对应一个class。
按照聚合与聚合根的规则,那么聚合与聚合内实体的关系应该是一种组合关系。
但现实中还会有一种实体间的关系,这种集合与集合中的实体不是组合关系,而是一种列表和列表中元素的关系,如,文章列表与文章的关系,这种关系下,文章列表是没有唯一ID的。那么,想请教老师,对于这种关系,DDD中是如何表述的?文章列表是作为一个实体类存在好呢?还是把列表做成一个文章实体的方法好呢?
2020-06-23 20:06:34
2020-03-26 08:27:54
2020-01-17 11:14:47
2019-11-01 06:41:44
从业务顺延的角度拆分,聚合、聚合根、实体、值对象这四个概念很好的模拟了业务的世界,就像面向对象所讲的一切皆对象,对象与对象之间的关系(聚合)。
疑惑有两点:持久化和实体之间关系的灵活性。
持久化(以关系型数据库为例):聚合内部强一致性,聚合之间最终一致性。聚合是由多个遵循一定规则的实体组成,实体的描述由值对象组成,这样的问题在于聚合、实体、值对象和数据库之间的对应关系不够直接,同时事务管理也比非DDD的方式复杂,如果严格遵循DDD的原则去做,可能会在对象->数据库这个关节会有较多的问题要解决。
实体之间的关系:跨聚合之间实体不能直接发生关系,这个是否会不够灵活,实践中是否会引发一些问题?
2020-11-19 08:00:14
2020-03-19 15:43:04
2020-03-07 08:40:11
2019-10-23 10:48:38
2021-12-10 17:25:34
场景:用户 与 地址
代码:按ddd原则设置
----==== 华丽的分割线 ====----
public class person {
public Interger id;
public String name;
...
public Address address;
// 其它方法
}
public class Address {
public String province;
public String city;
...
}
----==== 华丽的分割线 ====----
问题1:引述“第05篇的聚合节点”,...,值对象主要是属性集合,对实体的状态和特征进行描述。但实体和值对象都只是
个体化的对象,它们的行为表现出来的是个体的能力。
以上述代码为例,对实体的状态和特征进行描述,结合代码如何理解这句话。
问题2:若完全按照DDD的说话,数据表的设计应设计成单表,且在特殊场景中,如“第4篇”的“案例2”,以序列化对象的形
式存储。若我现在的需求是查出某个省或市等的人员有多少,是否应按范式对数据库进行设计,若是,在程序输出
person实体给其他程序使用时,是否应由代码查询 person 与 address的持续数据,最后组成ddd所说的person对
象并包含address值对象会好点,若是,那我们是否应一开始就应该按照数据库范式设计,以避免将来业务需要变
更,需要改动数据库表的结构和代码才能实现新需要。
问题3:引述“第01篇”的“战略设计”和“战术设计”以及“三步来划定领域模型和微服务的边界法”,
如果我没理解错的话,三步法与“战略设计”、“战术设计”不能对应该上,甚至在实践中可以忽略“战略”和“战术”的
概念。因为三步法中的,第一步是输出领域实体等领域对象,第二步是输出聚合对像,第三步是根据语义将多个聚
合组成领域模型。综合所述,三步法是一种自下而上的实践方法,而“战略”应该是一种更高维度的自上而下的方
法,“第01篇”中未给出自上而下的实践方法。不知道我有没有理解对呢?
问题4:引述“第02篇”桃树分解领域过程,再结合第01篇”的“战略设计”概念,我觉得分解桃树是一个自上而的分解领域过
程,符合“战略设计”的概念,但在实际应用中即难以应用,因为“桃树”是一个成型的产品,几乎不需要维护,所以
能够自上而下去分解领导,但现实中我们的应用是不稳定的经常变动,以上述"persion"和"address"为例,一开始
我们可以单表的形式,去编写实体代码,只需要符合,从用户中查出他们的地址信息。后来需求改变,需要查出某
个省或市的所有用户,这时候我们就得再编写一个Address带唯一id的实体,并且影响到Person,因此我觉得自上
而下地划分领域难以应用在实际开发中,并且在设计时应该要考虑到以后应用的变化,尽量使用范例设计数据表,
用程序处理值对象,不知道我这样的理解对不对?
问题5:假设,以“persion”和“address”为例,在某些特定的场景下,我是否可以把它分成person领域和address领域,
person包含address值对象,address包含person值对象,老师请问一下我的理解对吗?
还有就是再极端一点的情况,假设person是在db1,而address在db2,然后person是基于spring cloud开发的,
是一个独立的服务,同样address也是,那这时候老师是建立在各个微服务中采用多数据源的方法查person和
address的持续数据呢?还是通过feign跨服务查询自己实体所需要的值对象呢?
在此,先谢谢老师的解答,学生不胜感激