43 | 如何使用缓存优化系统性能?

你好,我是刘超。

缓存是我们提高系统性能的一项必不可少的技术,无论是前端、还是后端,都应用到了缓存技术。前端使用缓存,可以降低多次请求服务的压力;后端使用缓存,可以降低数据库操作的压力,提升读取数据的性能。

今天我们将从前端到服务端,系统了解下各个层级的缓存实现,并分别了解下各类缓存的优缺点以及应用场景。

前端缓存技术

如果你是一位Java开发工程师,你可能会想,我们有必要去了解前端的技术吗?

不想当将军的士兵不是好士兵,作为一个技术人员,不想做架构师的开发不是好开发。作为架构工程师的话,我们就很有必要去了解前端的知识点了,这样有助于我们设计和优化系统。前端做缓存,可以缓解服务端的压力,减少带宽的占用,同时也可以提升前端的查询性能。

1. 本地缓存

平时使用拦截器(例如Fiddler)或浏览器Debug时,我们经常会发现一些接口返回304状态码+ Not Modified字符串,如下图中的极客时间Web首页。

如果我们对前端缓存技术不了解,就很容易对此感到困惑。浏览器常用的一种缓存就是这种基于304响应状态实现的本地缓存了,通常这种缓存被称为协商缓存。

协商缓存,顾名思义就是与服务端协商之后,通过协商结果来判断是否使用本地缓存。

一般协商缓存可以基于请求头部中的If-Modified-Since字段与返回头部中的Last-Modified字段实现,也可以基于请求头部中的If-None-Match字段与返回头部中的ETag字段来实现。

两种方式的实现原理是一样的,前者是基于时间实现的,后者是基于一个唯一标识实现的,相对来说后者可以更加准确地判断文件内容是否被修改,避免由于时间篡改导致的不可靠问题。下面我们再来了解下整个缓存的实现流程:

  • 当浏览器第一次请求访问服务器资源时,服务器会在返回这个资源的同时,在Response头部加上ETag唯一标识,这个唯一标识的值是根据当前请求的资源生成的;
  • 当浏览器再次请求访问服务器中的该资源时,会在Request头部加上If-None-Match字段,该字段的值就是Response头部加上ETag唯一标识;
  • 服务器再次收到请求后,会根据请求中的If-None-Match值与当前请求的资源生成的唯一标识进行比较,如果值相等,则返回304 Not Modified,如果不相等,则在Response头部加上新的ETag唯一标识,并返回资源;
  • 如果浏览器收到304的请求响应状态码,则会从本地缓存中加载资源,否则更新资源。

本地缓存中除了这种协商缓存,还有一种就是强缓存的实现。

强缓存指的是只要判断缓存没有过期,则直接使用浏览器的本地缓存。如下图中,返回的是200状态码,但在size项中标识的是memory cache。

强缓存是利用Expires或者Cache-Control这两个HTTP Response Header实现的,它们都用来表示资源在客户端缓存的有效期。

Expires是一个绝对时间,而Cache-Control是一个相对时间,即一个过期时间大小,与协商缓存一样,基于Expires实现的强缓存也会因为时间问题导致缓存管理出现问题。我建议使用Cache-Control来实现强缓存。具体的实现流程如下:

  • 当浏览器第一次请求访问服务器资源时,服务器会在返回这个资源的同时,在Response头部加上Cache-Control,Cache-Control中设置了过期时间大小;
  • 浏览器再次请求访问服务器中的该资源时,会先通过请求资源的时间与Cache-Control中设置的过期时间大小,来计算出该资源是否过期,如果没有,则使用该缓存,否则请求服务器;
  • 服务器再次收到请求后,会再次更新Response头部的Cache-Control。

2. 网关缓存

除了以上本地缓存,我们还可以在网关中设置缓存,也就是我们熟悉的CDN。

CDN缓存是通过不同地点的缓存节点缓存资源副本,当用户访问相应的资源时,会调用最近的CDN节点返回请求资源,这种方式常用于视频资源的缓存。

服务层缓存技术

前端缓存一般用于缓存一些不常修改的常量数据或一些资源文件,大部分接口请求的数据都缓存在了服务端,方便统一管理缓存数据。

服务端缓存的初衷是为了提升系统性能。例如,数据库由于并发查询压力过大,可以使用缓存减轻数据库压力;在后台管理中的一些报表计算类数据,每次请求都需要大量计算,消耗系统CPU资源,我们可以使用缓存来保存计算结果。

服务端的缓存也分为进程缓存和分布式缓存,在Java中进程缓存就是JVM实现的缓存,常见的有我们经常使用的容器类,ArrayList、ConcurrentHashMap等,分布式缓存则是基于Redis实现的缓存。

1. 进程缓存

对于进程缓存,虽然数据的存取会更加高效,但JVM的堆内存数量是有限的,且在分布式环境下很难同步各个服务间的缓存更新,所以我们一般缓存一些数据量不大、更新频率较低的数据。常见的实现方式如下:

//静态常量
public final staticS String url = "https://time.geekbang.org";
//list容器
public static List<String> cacheList = new Vector<String>();
 //map容器   
private static final Map<String, Object> cacheMap= new ConcurrentHashMap<String, Object>();

除了Java自带的容器可以实现进程缓存,我们还可以基于Google实现的一套内存缓存组件Guava Cache来实现。

Guava Cache适用于高并发的多线程缓存,它和ConcurrentHashMap一样,都是基于分段锁实现的并发缓存。

Guava Cache同时也实现了数据淘汰机制,当我们设置了缓存的最大值后,当存储的数据超过了最大值时,它就会使用LRU算法淘汰数据。我们可以通过以下代码了解下Guava Cache的实现:

public class GuavaCacheDemo {
    public static void main(String[] args) {
        Cache<String,String> cache = CacheBuilder.newBuilder()
                .maximumSize(2)
                .build();
        cache.put("key1","value1");
        cache.put("key2","value2");
        cache.put("key3","value3");
        System.out.println("第一个值:" + cache.getIfPresent("key1"));
        System.out.println("第二个值:" + cache.getIfPresent("key2"));
        System.out.println("第三个值:" + cache.getIfPresent("key3"));
    }
}

运行结果:

第一个值:null
第二个值:value2
第三个值:value3

那如果我们的数据量比较大,且数据更新频繁,又是在分布式部署的情况下,想要使用JVM堆内存作为缓存,这时我们又该如何去实现呢?

Ehcache是一个不错的选择,Ehcache经常在Hibernate中出现,主要用来缓存查询数据结果。Ehcache是Apache开源的一套缓存管理类库,是基于JVM堆内存实现的缓存,同时具备多种缓存失效策略,支持磁盘持久化以及分布式缓存机制。

2. 分布式缓存

由于高并发对数据一致性的要求比较严格,我一般不建议使用Ehcache缓存有一致性要求的数据。对于分布式缓存,我们建议使用Redis来实现,Redis相当于一个内存数据库,由于是纯内存操作,又是基于单线程串行实现,查询性能极高,读速度超过了10W次/秒。

Redis除了高性能的特点之外,还支持不同类型的数据结构,常见的有string、list、set、hash等,还支持数据淘汰策略、数据持久化以及事务等。

两种缓存讲完了,接下来我们看看其中可能出现的问题。

数据库与缓存数据一致性问题

在查询缓存数据时,我们会先读取缓存,如果缓存中没有该数据,则会去数据库中查询,之后再放入到缓存中。

当我们的数据被缓存之后,一旦数据被修改(修改时也是删除缓存中的数据)或删除,我们就需要同时操作缓存和数据库。这时,就会存在一个数据不一致的问题。

例如,在并发情况下,当A操作使得数据发生删除变更,那么该操作会先删除缓存中的数据,之后再去删除数据库中的数据,此时若是还没有删除成功,另外一个请求查询操作B进来了,发现缓存中已经没有了数据,则会去数据库中查询,此时发现有数据,B操作获取之后又将数据存放在了缓存中,随后数据库的数据又被删除了。此时就出现了数据不一致的情况。

那如果先删除数据库,再删除缓存呢?

我们可以试一试。在并发情况下,当A操作使得数据发生删除变更,那么该操作会先删除了数据库的操作,接下来删除缓存,失败了,那么缓存中的数据没有被删除,而数据库的数据已经被删除了,同样会存在数据不一致的问题。

所以,我们还是需要先做缓存删除操作,再去完成数据库操作。那我们又该如何避免高并发下,数据更新删除操作所带来的数据不一致的问题呢?

通常的解决方案是,如果我们需要使用一个线程安全队列来缓存更新或删除的数据,当A操作变更数据时,会先删除一个缓存数据,此时通过线程安全的方式将缓存数据放入到队列中,并通过一个线程进行数据库的数据删除操作。

当有另一个查询请求B进来时,如果发现缓存中没有该值,则会先去队列中查看该数据是否正在被更新或删除,如果队列中有该数据,则阻塞等待,直到A操作数据库成功之后,唤醒该阻塞线程,再去数据库中查询该数据。

但其实这种实现也存在很多缺陷,例如,可能存在读请求被长时间阻塞,高并发时低吞吐量等问题。所以我们在考虑缓存时,如果数据更新比较频繁且对数据有一定的一致性要求,我通常不建议使用缓存。

缓存穿透、缓存击穿、缓存雪崩

对于分布式缓存实现大数据的存储,除了数据不一致的问题以外,还有缓存穿透、缓存击穿、缓存雪崩等问题,我们平时实现缓存代码时,应该充分、全面地考虑这些问题。

缓存穿透是指大量查询没有命中缓存,直接去到数据库中查询,如果查询量比较大,会导致数据库的查询流量大,对数据库造成压力。

通常有两种解决方案,一种是将第一次查询的空值缓存起来,同时设置一个比较短的过期时间。但这种解决方案存在一个安全漏洞,就是当黑客利用大量没有缓存的key攻击系统时,缓存的内存会被占满溢出。

另一种则是使用布隆过滤算法(BloomFilter),该算法可以用于检查一个元素是否存在,返回结果有两种:可能存在或一定不存在。这种情况很适合用来解决故意攻击系统的缓存穿透问题,在最初缓存数据时也将key值缓存在布隆过滤器的BitArray中,当有key值查询时,对于一定不存在的key值,我们可以直接返回空值,对于可能存在的key值,我们会去缓存中查询,如果没有值,再去数据库中查询。

BloomFilter的实现原理与Redis中的BitMap类似,首先初始化一个m长度的数组,并且每个bit初始化值都是0,当插入一个元素时,会使用n个hash函数来计算出n个不同的值,分别代表所在数组的位置,然后再将这些位置的值设置为1。

假设我们插入两个key值分别为20,28的元素,通过两次哈希函数取模后的值分别为4,9以及14,19,因此4,9以及14,19都被设置为1。

那为什么说BloomFilter返回的结果是可能存在和一定不存在呢?

假设我们查找一个元素25,通过n次哈希函数取模后的值为1,9,14。此时在BitArray中肯定是不存在的。而当我们查找一个元素21的时候,n次哈希函数取模后的值为9,14,此时会返回可能存在的结果,但实际上是不存在的。

BloomFilter不允许删除任何元素的,为什么?假设以上20,25,28三个元素都存在于BitArray中,取模的位置值分别为4,9、1,9,14以及14,19,如果我们要删除元素25,此时需要将1,9,14的位置都置回0,这样就影响20,28元素了。

因此,BloomFilter是不允许删除任何元素的,这样会导致已经删除的元素依然返回可能存在的结果,也会影响BloomFilter判断的准确率,解决的方法则是重建一个BitArray。

那什么缓存击穿呢?在高并发情况下,同时查询一个key时,key值由于某种原因突然失效(设置过期时间或缓存服务宕机),就会导致同一时间,这些请求都去查询数据库了。这种情况经常出现在查询热点数据的场景中。通常我们会在查询数据库时,使用排斥锁来实现有序地请求数据库,减少数据库的并发压力。

缓存雪崩则与缓存击穿差不多,区别就是失效缓存的规模。雪崩一般是指发生大规模的缓存失效情况,例如,缓存的过期时间同一时间过期了,缓存服务宕机了。对于大量缓存的过期时间同一时间过期的问题,我们可以采用分散过期时间来解决;而针对缓存服务宕机的情况,我们可以采用分布式集群来实现缓存服务。

总结

从前端到后端,对于一些不常变化的数据,我们都可以将其缓存起来,这样既可以提高查询效率,又可以降低请求后端的压力。对于前端来说,一些静态资源文件都是会被缓存在浏览器端,除了静态资源文件,我们还可以缓存一些常量数据,例如商品信息。

服务端的缓存,包括了JVM的堆内存作为缓存以及Redis实现的分布式缓存。如果是一些不常修改的数据,数据量小,且对缓存数据没有严格的一致性要求,我们就可以使用堆内存缓存数据,这样既实现简单,查询也非常高效。如果数据量比较大,且是经常被修改的数据,或对缓存数据有严格的一致性要求,我们就可以使用分布式缓存来存储。

在使用后端缓存时,我们应该注意数据库和缓存数据的修改导致的数据不一致问题,如果对缓存与数据库数据有非常严格的一致性要求,我就不建议使用缓存了。

同时,我们应该针对大量请求缓存的接口做好预防工作,防止查询缓存的接口出现缓存穿透、缓存击穿和缓存雪崩等问题。

思考题

在基于Redis实现的分布式缓存中,我们更新数据时,为什么建议直接将缓存中的数据删除,而不是更新缓存中的数据呢?

期待在留言区看到你的答案。也欢迎你点击“请朋友读”,把今天的内容分享给身边的朋友,邀请他一起讨论。

精选留言

  • QQ怪

    2019-08-29 22:36:07

    学到了很多,挺收益的,思考题:更新效率太低,代价很大,且不一定被访问的频率高,不高则没必要缓存,还不如直接删掉,而且还容易出现数据不一致问题
    作者回复

    👍🏻 对的,两个并发写去更新还存在一致性的问题。不过,在删除缓存后,记得读取数据需要加锁或延时等待,防止读取脏数据。

    2019-08-30 09:20:10

  • Loubobooo

    2019-08-29 14:19:14

    课后题:原因很简单
    1. 很多时候,在复杂点的缓存场景,缓存不单单是数据库中直接取出来的值。比如可能更新了某个表的一个字段,然后其对应的缓存,是需要查询另外两个表的数据并进行运算,才能计算出缓存最新的值的。
    另外更新缓存的代价有时候是很高的。每次修改数据库的时候,都一定要将其对应的缓存更新一份,这样做的代价较高。如果遇到复杂的缓存数据计算的场景,缓存频繁更新,但这个缓存到底会不会被频繁访问到?如果没有,这个缓存的效率就很低了
    作者回复

    👍🏻 回答很全面

    2019-08-30 09:40:07

  • giserway

    2019-08-29 07:32:31

    还有就是更新缓存代价大。如果缓存里的数据不是把数据库里的数据直接存下来,而是需要经过某种复杂的运算,那么这种不必要的更新会带来更大的浪费。
    作者回复

    对的,这也是一种情况

    2019-08-30 09:57:33

  • 一张韵

    2020-08-29 13:02:38

    缓存的三种问题
    - 缓存穿透:大批量请求不存在的key,导致数据库压力增大。【解决方案】:布隆过滤器。
    - 缓存击穿:同一时间大批量请求一个过期的key,导致这些请求在同一时间访问数据库。【解决方案】:获取数据库后回写这个过程申请分布式锁,只有一个请求能获取后回写,其他一直重试等待。
    - 缓存雪崩:同一时间大批量key过期。【解决方案】:设置expire time的时候随机加1~5分钟的超时。

    数据库和缓存一致性解决:
    【Cache Aside Pattern】因为更新数据库后删除缓存的话,如果缓存删除失败,则会存在不一致的问题,所以需要先删除缓存后更新数据库。但是这里可能存在删除缓存后有**其他请求**判断缓存没有数据则从数据库中读取后回写导致的不一致问题,所以需要再进一步:删除缓存后,把缓存数据放到一个队列,其他请求到来的时候判断缓存里面没数据,再去队列里面查看,如果队列里面有这个缓存数据,则一直阻塞等待,知道前一个请求把数据库更新完毕后再唤醒。
  • yungoo

    2019-08-29 06:58:13

    基于redis集中缓存更新数据采用删除而不是直接更新缓存的原因之一:避免二类更新丢失问题。

    分布式系统中当存在并发数据更新时,因无法保证更新操作顺序的时间一致性,从而导致旧值覆盖新值。

    如:
    t1时间点,A进程发起更新key1为1的P1操作。
    t1+x时间点,B进程发起更新key1为2的P2操作。
    其中P1 -> P2,数据库中值为2。

    而redis收到的指令,可能因网络抖动或者STW,实际为P2 -> P1,缓存的值为1,造成数据不一致。
    作者回复

    👍🏻 存在并发更新时数据不一致问题

    2019-08-30 09:58:39

  • 2019-09-12 23:14:40

    我觉得看场景,我们是电商的核心系统,计算全部依赖缓存,我们的缓存是经过复杂计算的结构数据,每天定时任务刷新,更新是全部是先添加有效数据后删除无效数据。添加有效数据时,如果数据存在就是更新操作了啦!我觉得挺OK的
  • Maxwell

    2019-08-29 09:18:56

    老师您说的:通常我们会在查询数据库时,使用排斥锁来实现有序地请求数据库,减少数据库的并发压力。这个通常哪些方案?
    作者回复

    最常用的就是使用同步锁或Lock锁实现。

    2019-08-30 09:50:20

  • giserway

    2019-08-29 07:31:02

    如果是更新数据库再操作缓存的话,此时更新缓存的操作不是必须的。可能缓存里的数据并没有被读到,就会被下一次更新MySQL操作带来Redis更新操作覆盖,那么本次更新操作就是无意义的。
  • victoriest

    2019-08-30 10:28:33

    只看 模块七 值回票价
  • 许童童

    2019-08-29 14:40:34

    直接更新缓存中的数据,因为请求到达的顺序无法保证,有可能后请求的数据覆盖前请求的数据。直接将数据删除,就是一种幂等的操作,删除后,再去数据库拉数据,就不会有覆写的问题。
    作者回复

    对的,如果两个并发写去更新还存在一致性的问题,还不如直接删除,等下次读取的时候再次写入缓存中。不过,在删除缓存后,记得读取数据需要加锁或延时等待,防止读取脏数据。

    2019-08-30 09:38:13

  • 耿嘉艺

    2020-06-17 20:31:13

    更新缓存的时候,加锁保证一致性,不行吗?毕竟redis执行还是单线程的
  • ty_young

    2019-10-31 21:25:36

    老师您好,请问协商缓存和强制缓存没有关联么,不会先走强制缓存,然后在强制缓存的基础上走协商缓存
    作者回复

    强制缓存只有两种情况,要么访问服务端,要么用本地缓存,所以加上协商缓存意义不大

    2020-03-12 20:47:53

  • 💢 星星💢

    2019-09-29 23:00:07

    老师,我有个问题,分布式更新或者删除缓存的时候,为啥不对这个操作加锁呢,例如a线程更新或者删除缓存,并更新数据库,然后解锁。此时b线程在争夺锁。并且持有锁。是不是性能问题,所以不这样,还是我理解错了?
    作者回复

    没有理解错,锁和我文中提到的队列都是解决redis缓存数据一致性问题的方案,这种解决方案会带来一定的性能损耗

    2019-09-30 11:19:59

  • Better me

    2019-08-29 21:34:57

    布隆过滤器为什么要经过n个hash函数散列,有什么特别的考虑吗
    作者回复

    这是为了计算不同的位置,通过不同位置置1,得出一个数值。

    2019-08-30 09:21:40

  • -W.LI-

    2019-08-29 08:10:33

    老师真棒,全能。
    CDN的缓存策略是copy服务端的,协商缓存和强缓存?如果有些静态资源,服务端开发没做缓存策略,CDN还会缓存么?实际开发中用过一次CDN。是在资源路径前,拼接一段CDN路径。具体不知
    课后习题,如果并发操作时,虽然redis是单线程的但是没法保证网络延时下,先更新数据库。也先更新缓存。个人感觉失效一个key比写一个key开销小。网络传输上看,update还得传一个value的值,redis更新还得写缓存感觉也是失效慢。并发情况写两次(除开正确性)有一次的写完全浪费。
    作者回复

    通常我们是会指定一些静态资源文件上传到CDN上去,并且通过版本号来更新。例如,我们的js资源文件是 xxx001.js,如果我们更新了该资源文件,则将xxx002.js推送到CDN上,同时前端的访问路径也更新访问资源路径。

    2019-08-30 09:57:15

  • 防腐基

    2022-08-09 18:08:38

    缓存击穿的解决方案作者说的是使用排斥锁,我这里提供另一个更简单的方案。
    直接设置成永不过期即可,原因很简单,达到缓存击穿这个量级的公司凤毛麟角,绝大部分程序员可能整个职业生涯都遇不到。
    所以,对于可能出现这种情况的极少数的热点key,直接设置永不过期即可,一劳永逸,也省得动脑了。
  • 平民人之助

    2021-07-11 12:28:52

    更新不是用redisson的getandset操作吗
  • null

    2021-05-08 22:55:46

    原文:
    当 A 操作变更数据时,会先删除一个缓存数据,此时通过线程安全的方式将缓存数据放入到队列中,并通过一个线程进行数据库的数据删除操作。
    当有另一个查询请求 B 进来时,…,如果队列中有该数据,则阻塞等待,直到 A 操作数据库成功之后,唤醒该阻塞线程,再去数据库中查询该数据。

    问题:
    老师好,原文的这段话,有点不太明白。
    1. 线程安全的队列,不能是 JVM 中的队列吧。分布式环境,用 redis 队列?
    2. 为什么要通过另一个线程去更新数据库,此时 A 线程不就空闲了么?
    3. 分布式环境下,A 线程如何阻塞和唤醒 B 线程?

    谢谢老师!
  • null

    2021-05-08 18:38:41

    Cache-Control: max-age=60天
    不能依赖本地时间,浏览器怎么去维护是否过期吖?

    谢谢老师!
  • James

    2021-02-23 19:12:01

    你好。问答题。

    两个并发写去更新还存在一致性的问题。不过,在删除缓存后,记得读取数据需要加锁或延时等待,防止读取脏数据。

    一致性问题理解了,
    后面读取数据是另外一个查询接口加锁?
    原先接口删除缓存,读取数据库更新缓存时候加锁?