三种缓存策略：Cache Aside 策略、Read/Write Through 策略、Write Back 策略-6ren

三种缓存策略：Cache Aside 策略、Read/Write Through 策略、Write Back 策略

转载作者：知者更新时间：2024-03-12 12:37:11

31

4

作者：小林coding
计算机八股文网站：https://xiaolincoding.com

大家好，我是小林。

今天跟大家聊聊，常见的缓存更新策略。

Cache Aside（旁路缓存）策略；
Read/Write Through（读穿 / 写穿）策略；
Write Back（写回）策略；

实际开发中，Redis 和 MySQL 的更新策略用的是 Cache Aside，另外两种策略主要应用在计算机系统里。

Cache Aside（旁路缓存）策略

Cache Aside（旁路缓存）策略是最常用的，应用程序直接与「数据库、缓存」交互，并负责对缓存的维护，该策略又可以细分为「读策略」和「写策略」。

写策略的步骤：

先更新数据库中的数据，再删除缓存中的数据。

读策略的步骤：

如果读取的数据命中了缓存，则直接返回数据；
如果读取的数据没有命中缓存，则从数据库中读取数据，然后将数据写入到缓存，并且返回给用户。

注意，写策略的步骤的顺序顺序不能倒过来，即不能先删除缓存再更新数据库，原因是在「读+写」并发的时候，会出现缓存和数据库的数据不一致性的问题。

举个例子，假设某个用户的年龄是 20，请求 A 要更新用户年龄为 21，所以它会删除缓存中的内容。这时，另一个请求 B 要读取这个用户的年龄，它查询缓存发现未命中后，会从数据库中读取到年龄为 20，并且写入到缓存中，然后请求 A 继续更改数据库，将用户的年龄更新为 21。

最终，该用户年龄在缓存中是 20（旧值），在数据库中是 21（新值），缓存和数据库的数据不一致。

为什么「先更新数据库再删除缓存」不会有数据不一致的问题？

继续用「读 + 写」请求的并发的场景来分析。

假如某个用户数据在缓存中不存在，请求 A 读取数据时从数据库中查询到年龄为 20，在未写入缓存中时另一个请求 B 更新数据。它更新数据库中的年龄为 21，并且清空缓存。这时请求 A 把从数据库中读到的年龄为 20 的数据写入到缓存中。

最终，该用户年龄在缓存中是 20（旧值），在数据库中是 21（新值），缓存和数据库数据不一致。从上面的理论上分析，先更新数据库，再删除缓存也是会出现数据不一致性的问题，但是在实际中，这个问题出现的概率并不高。

因为缓存的写入通常要远远快于数据库的写入，所以在实际中很难出现请求 B 已经更新了数据库并且删除了缓存，请求 A 才更新完缓存的情况。而一旦请求 A 早于请求 B 删除缓存之前更新了缓存，那么接下来的请求就会因为缓存不命中而从数据库中重新读取数据，所以不会出现这种不一致的情况。

Cache Aside 策略适合读多写少的场景，不适合写多的场景，因为当写入比较频繁时，缓存中的数据会被频繁地清理，这样会对缓存的命中率有一些影响。如果业务对缓存命中率有严格的要求，那么可以考虑两种解决方案：

一种做法是在更新数据时也更新缓存，只是在更新缓存前先加一个分布式锁，因为这样在同一时间只允许一个线程更新缓存，就不会产生并发问题了。当然这么做对于写入的性能会有一些影响；
另一种做法同样也是在更新数据时更新缓存，只是给缓存加一个较短的过期时间，这样即使出现缓存不一致的情况，缓存的数据也会很快过期，对业务的影响也是可以接受。

Read/Write Through（读穿 / 写穿）策略

Read/Write Through（读穿 / 写穿）策略原则是应用程序只和缓存交互，不再和数据库交互，而是由缓存和数据库交互，相当于更新数据库的操作由缓存自己代理了。

Read Through 策略

先查询缓存中数据是否存在，如果存在则直接返回，如果不存在，则由缓存组件负责从数据库查询数据，并将结果写入到缓存组件，最后缓存组件将数据返回给应用。

Write Through 策略

当有数据更新的时候，先查询要写入的数据在缓存中是否已经存在：

如果缓存中数据已经存在，则更新缓存中的数据，并且由缓存组件同步更新到数据库中，然后缓存组件告知应用程序更新完成。
如果缓存中数据不存在，直接更新数据库，然后返回；

下面是 Read Through/Write Through 策略的示意图：

Read Through/Write Through 策略的特点是由缓存节点而非应用程序来和数据库打交道，在我们开发过程中相比 Cache Aside 策略要少见一些，原因是我们经常使用的分布式缓存组件，无论是 Memcached 还是 Redis 都不提供写入数据库和自动加载数据库中的数据的功能。而我们在使用本地缓存的时候可以考虑使用这种策略。

Write Back（写回）策略

Write Back（写回）策略在更新数据的时候，只更新缓存，同时将缓存数据设置为脏的，然后立马返回，并不会更新数据库。对于数据库的更新，会通过批量异步更新的方式进行。

实际上，Write Back（写回）策略也不能应用到我们常用的数据库和缓存的场景中，因为 Redis 并没有异步更新数据库的功能。

Write Back 是计算机体系结构中的设计，比如 CPU 的缓存、操作系统中文件系统的缓存都采用了 Write Back（写回）策略。

Write Back 策略特别适合写多的场景，因为发生写操作的时候，只需要更新缓存，就立马返回了。比如，写文件的时候，实际上是写入到文件系统的缓存就返回了，并不会写磁盘。

但是带来的问题是，数据不是强一致性的，而且会有数据丢失的风险，因为缓存一般使用内存，而内存是非持久化的，所以一旦缓存机器掉电，就会造成原本缓存中的脏数据丢失。所以你会发现系统在掉电之后，之前写入的文件会有部分丢失，就是因为 Page Cache 还没有来得及刷盘造成的。

这里贴一张 CPU 缓存与内存使用 Write Back 策略的流程图：

有没有觉得这个流程很熟悉？因为我在写 CPU 缓存文章的时候提到过。

系列《图解Redis》文章

面试篇
- 3 万字 + 40 张图｜攻破 40 道 Redis 常见面试题

数据类型篇

31

4

0

文章推荐： LeetCode_前缀和_困难_862.和至少为 K 的最短子数组

文章推荐： VUE学习笔记详细

文章推荐： HDFS、Yarn、Hive…MRS中使用Ranger实现权限管理全栈式实践

文章推荐：动手实践丨手把手教你用STM32做一个智能鱼缸

caching - 我什么时候应该使用 Cache-Control : no-cache?
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
c# - 如何修改CPU Cache L1、Cache L2、Cache L3？
关闭。这个问题需要details or clarity .它目前不接受答案。想改进这个问题吗？通过 editing this post 添加细节并澄清问题. 关闭 8 年前。 Improve t
python - 为什么使用 apt.Cache 而不是 apt.cache.Cache() 创建对象
我卡在了一个点上，我无法进步，很抱歉这个愚蠢的问题。我为此进行了很多搜索，但我不知道我错过了什么。请帮助我。我研究了 python 中的模块和类。现在我想使用 python 和 apt 进行一些操作
caching - X-Cache-Status 始终使用 Kong proxy-cache 插件绕过
我在 Kong 有服务，我已经为该服务设置了代理缓存插件。 curl -X POST http://localhost:8001/plugins --data "name=proxy-cache"--
caching - ASP.NET 核心 WebAPI : Memory Caching vs Response Caching
ASP.NET Core 提供内存缓存和响应缓存。假设该应用程序是 ASP.NET Core WebAPI，它通过配置的响应缓存中间件将 SQL 数据库中的数据传送给用户。在什么情况下也使用内存缓
caching - 面试题 : Factorials and caching
我最近遇到了以下面试问题: You need to design a system to provide answers to factorials for between 1 and 100. Yo
jQuery 对象 : to cache or not to cache?
我的 Javascript (JS) 代码遇到了一些麻烦，因为我有时需要在同一个函数中多次访问相同的 DOM 元素。还提供了一些推理here . 从性能的角度来看，是一次性创建一个 jQuery 对象
caching - InterSystems Cache，在哪里可以找到全局定义
仅使用 Cache 终端，我使用或查看什么实用程序函数或 Global 来查找存在于 Cache 数据库中的所有 Globals 的列表？再次仅在缓存终端中使用，我使用或查看什么实用程序功能或全局以
jQuery 对象 : to cache or not to cache?
我的 Javascript (JS) 代码遇到了一些麻烦，因为有时我需要在同一个函数中多次访问同一个 DOM 元素。还提供了一些推理here . 从性能的角度来看，是先创建一个jQuery对象然后缓存
caching - Cache-Control 的无缓存和必须重新验证之间的区别？
来自 RFC 2616 http://www.w3.org/Protocols/rfc2616/rfc2616-sec14.html#sec14.9.1 no-cache If the no-cach
caching - Cache put item并发和吞吐量
大多数 CDN 服务器对经常访问的内容使用缓存。场景:假设有人上传了一张非常热门的图片，并且来自同一位置的许多用户 (1000) 试图访问该图片。问题:假设网络服务器收到一个请求，首先检查它的缓存
jQuery 对象 : to cache or not to cache?
我的 Javascript (JS) 代码遇到了一些麻烦，因为有时我需要在同一个函数中多次访问同一个 DOM 元素。还提供了一些推理here . 从性能的角度来看，是先创建一个jQuery对象然后缓存
caching - 如果 Cache-Control 有 `no-cache` 和 `max-age=900` 会发生什么？
如果我将服务器响应设置为:Cache-Control: private,no-cache,max-age=900 ? 如果标题是这样的，会发生什么:Cache-Control: public,no-c
.net - dotnet System.Web.Caching.Cache 与 System.Runtime.Caching.MemoryCache
我有一个类需要在缓存中存储数据。最初我在 ASP.NET 应用程序中使用它，所以我使用了 System.Web.Caching.Cache。现在我需要在 Windows 服务中使用它。现在，据我了解
caching - Drupal 7 & Varnish 4 - 我总是得到 X-Drupal-Cache : MISS but X-Cache: HIT
我遇到了和这个人一样的问题:X-Drupal-Cache for Drupal 7 website always hits MISS ，并且找不到出路。我正在运行 Drupal 7 - 新闻流和
php - 在 Laravel 中 artisan config :cache actually cache the config as specified in the cache. php 设置？
我已将 Laravel 设置为使用 Redis 作为缓存。当我使用 Cache::('my_var', 'my_val'); 然后通过 CLI 检查 Redis 以查看 key 是否已创建时，我可以验
Windows azure 缓存错误 - "Cache referred to does not exist. Contact administrator or use the Cache administration tool to create a Cache."
我在 Windows Azure 云上有一个应用程序，并且正在使用 Windows Azure 共置缓存。有时，当我发布网站/web服务时，调用DataCacheFactory.GetCache方法
caching - Apollo 服务器端缓存 : What is cache keyed on?
我正在阅读 documentation for Apollo server-side caching ，但看不到任何关于缓存通常如何加密的内容。我需要的是一个以响应中包含的对象 ID 为键的缓存，而
hibernate - Grails\hibernate : To cache or not to cache?
Hibernate\Grails 中最好的缓存策略是什么？是否缓存所有实体和查询以及如何找到最佳解决方案？这是我的 hibernate 配置。 hibernate { cache.use_sec
caching - 'Nuget.Proxy Cache' 的类型初始化程序引发异常
我收到错误 'Nuget.Proxy Cache' 的类型初始化器抛出异常尝试连接到 Nuget 官方包源时。我在公司网络后面，但是我怀疑问题是连接性。有任何想法吗？最佳答案我有同样的问题。我

首页

博学

6Ren·AI

商城