GaussDB(for MySQL) ：Partial Result Cache，通过缓存中间结果对算子进行加速-6ren

GaussDB(for MySQL) ：Partial Result Cache，通过缓存中间结果对算子进行加速

转载作者：知者更新时间：2024-03-13 03:12:03

**摘要：**华为云数据库高级内核技术专家详解GaussDB(for MySQL)Partial Result Cache特性，如何通过缓存中间结果对算子进行加速？

本文分享自华为云社区《GaussDB创新特性解读：Partial Result Cache，通过缓存中间结果对算子进行加速》，作者：GaussDB 数据库。

为了加速查询性能，传统的关系型数据库，比如Oracle、DB2，都有结果集缓存的特性，用来缓存一条查询语句的结果集。如果后续同样的语句被查询，数据库将直接从结果集缓存中获取结果，而不用再重新执行该查询。MySQL 在4.0版本中也引入了结果集缓存Query cache，但是在设计上有局限性，具体如下：

Query cache针对单个查询，任何一个表做了修改，如果影响到结果集就需要刷新或者失效。
Query cache对隔离级别有依赖，不同的隔离级别产生的结果集不一样。
Query cache需要对所有数据进行缓存，如果表结果比较大的话，缓存需要占据较大的内存或者写入磁盘。

这也导致了该特性在MySQL 8.0版本被移除。

鉴于结果集缓存对查询性能的增益，我们在GaussDB(for MySQL)引入Partial result cache这一新特性，简称PTRC。顾名思义，这也是一个结果集缓存特性。不同于传统的结果集缓存，PTRC是用来辅助单个查询的内部算子的执行。也就是说PTRC粒度更小，是对查询内部的某个算子的中间结果进行缓存，从而起到算子加速的作用。

这里的Partial 有两层概念：

从这两点可以看出，PTRC是与单个查询相关的，生命周期从查询开始到查询结束，自动终止。由于它是对算子进行加速，所以一个查询内部可以有多个PTRC。只要优化器根据代价计算，认为该算子适合PTRC，那么优化器就会为该算子引入PTRC。

PTRC如何确定对算子并加速？

这里我们引入一个新概念：参数化的重复扫描，指的是扫描算子根据参数的不同进行算子扫描。比如Nested Loop Join，对于外表扫描的每一条数据，内表会根据JOIN条件进行扫描，那么对于内表来说就是一次“参数化的重复扫描”。再比如correlated subquery，对于父查询的每一次扫描都会根据父查询的结果集调用子查询执行，然后返回子查询的结果集。

PTRC是如何工作的？

如前所述，PTRC是缓存算子的中间结果集，那么也和其他cache一样，将数据以key ，value的方式缓存到cache中，通过key来命中，得到value。那么PTRC的相关key和value是如何获取的？

下面我们以Correlated subquery为例做简单分析，查询语句如下：

SELECT *
FROM   t1
WHERE  t1.a IN (SELECT a
                FROM   t2,
                       t3
                WHERE  t2.b = t1.b
                       AND t2. c > t3.d);

上图是子查询使用EXISTS策略执行的流程图。可以看出：对于数据表t1中的每一条数据，都会驱动子查询执行，直到数据表t1中的所有记录都循环结束。对于数据表t1中的每一条记录对应的t1.a，都需要根据该列值重新扫描子查询，进而判断子查询的返回值。

我们通过EXPLAIN来对比引入PTRC前后执行计划的差异：

EXPLAIN format=tree

SELECT *
FROM   t1
WHERE  t1.a IN (SELECT a
                FROM   t2,
                       t3
                WHERE  t2.b = t1.b
                       AND t2. c > t3.d);

-> Filter: <in_optimizer>(t1.a,<exists>(select #2))  (cost=0.35 rows=1)
    -> Table scan on t1  (cost=0.35 rows=1)
    -> Select #2 (subquery in condition; dependent)
        -> Result cache : cache keys(t1.a, t1.b)
            -> Limit: 1 row(s)  (cost=0.80 rows=1)
                -> Filter: (t2.c > t3.d)  (cost=0.80 rows=1)
                    -> Inner hash join (no condition)  (cost=0.80 rows=1)
                        -> Table scan on t3  (cost=0.35 rows=2)
                        -> Hash
                            -> Filter: ((t2.b = t1.b) and (<cache>(t1.a) = t2.a))  (cost=0.35 rows=1)
                                -> Table scan on t2  (cost=0.35 rows=1)

可以看出引入PTRC后，多了一个算子Result cache（标红部分），表明该算子当前的子查询引入了PTRC，引入后的执行流程变更为：

引入PTRC后，对于数据表t1中的每一条数据对应的t1.a列值，优先查看PTRC，如果命中，直接从PTRC中获取结果集，而不需要执行子查询。如果未命中，需要按原来的方式继续执行子查询，子查询执行的结果会储存到PTRC中。如果下一次同样的列值来驱动执行子查询，可以直接从PTRC获取。

优化器如何选择PTRC？

优化器在为算子选择PTRC的时候会依赖代价估算，主要是看命中率（命中率 = 不同键值的行数/键值的总行数），如果命中率大于rds_partial_result_cache_cost_threshold（具体含义参考下文的系统变量介绍）变量定义的最小代价，PTRC将会被选择，反之则不会被选择。是否选择了PTRC，可以通过Explain format=tree或者Explain analyze来观察实际的命中情况。我们通过一个例子来说明：

EXPLAIN analyze

SELECT *
FROM   t1
WHERE  t1.a IN (SELECT a
                FROM   t2,
                       t3
                WHERE  t2.b = t1.b
                       AND t2. c > t3.d);

-> Filter: <in_optimizer>(t1.a,<exists>(select #2))  (cost=0.35 rows=1) (actual time=3800.595..3800.595 rows=0 loops=1)
    -> Table scan on t1  (cost=0.35 rows=1) (actual time=0.064..0.093 rows=1 loops=1)
    -> Select #2 (subquery in condition; dependent)
        -> Result cache : cache keys(t1.a, t1.b) (Cache Hits: 0, Cache Misses：1, Cache Evictions: 0, Cache Overflows: 0, Memory Usage: 40960 )  (actual time=0.115..0.115 rows=0 loops=1)
            -> Limit: 1 row(s)  (cost=0.80 rows=1) (actual time=0.094..0.094 rows=0 loops=1)
                -> Filter: (t2.c > t3.d)  (cost=0.80 rows=1) (actual time=0.093..0.093 rows=0 loops=1)
                    -> Inner hash join (no condition)  (cost=0.80 rows=1) (actual time=0.092..0.092 rows=0 loops=1)
                        -> Table scan on t3  (cost=0.35 rows=2) (never executed)
                        -> Hash
                            -> Filter: ((t2.b = t1.b) and (<cache>(t1.a) = t1.a))  (cost=0.35 rows=1) (actual time=0.039..0.039 rows=0 loops=1)
                                -> Table scan on t2  (cost=0.35 rows=1) (actual time=0.038..0.038 rows=0 loops=1)

从Result cache这个算子后面可以看到：

Cache Hits: 0，表示命中的次数为0
Cache Misses：1，表示没有命中的次数为1
Cache Evictions: 0，表示使用LRU淘汰的记录数
Cache Overflows: 0，表示内存overflow的次数
Memory Usage: 40960，表示当前查询使用的内存量

由于优化器使用代价估算来计算是否使用PTRC，如果估算错误的话，PTRC还是有额外的代价，比如创建自身的一些数据结构，以及记录的拷贝。为了尽可能的保证查询的性能，PTRC采取了动态反馈的方式来查看PTRC在实际执行的过程中是否继续使用。PTRC会自动判断命中率是否适合保留PTRC，优化器根据没有命中的次数，每隔rds_partial_result_cache_hit_ratio_frequency会检查命中率是否低于rds_partial_result_cache_min_hit_ratio。如果低于该值，优化器会自动禁止继续使用PTRC。

优化器如何限制PTRC的内存使用

由于单个查询可以有多个PTRC算子，每个算子都会使用内存来存储缓存数据，那么控制PTRC内存使用就非常有必要，以防止内存OOM。

通过系统变量rds_partial_result_cache_max_mem_size来定义每个查询所使用的所有PTRC算子使用的最大内存。如果PTRC使用的内存总数超过该值，优化器会根据LRU算法来进行淘汰。如果通过LRU算法可以找到适合当前存储记录的大小的记录进行淘汰，当前记录可以进行缓存，否则当前记录将不被缓存。

PTRC如何配置？

首先，PTRC默认是开启的，可以通过Optimizer_switch中的partial_result_cache选项更改设置：设置为ON，启用PTRC，否则就关闭。通过下表中的4个系统变量，对PTRC进行具体设置。

PTRC性能测试

下面是我们使用TPCH的Q17来测试不同数据量下启用PTRC前后的性能变化。

由于PTRC是一个cache，所以命中率越高性能提升就会越高。当然如果PTRC相关的算子执行代价越高的话，那么PTRC获取的性能提升也是越高的。

MariaDB的subquery cache是对重复扫描算子correlated subquery进行加速引入的一个特性，我们参照MariaDB的subquery cache测试样例，同样基于dbt-3 scale 1 数据集，测试PTRC对于correlated subquery的加速效果。

由于MySQL和MariaDB索引创建的不同，执行时间与MariaDB不同，这里只需要关注相对时间即可。测试结果如下表所示：

可以看出：上表中最后一行命中率为0的情况下，PTRC默认值检查如果miss了200条之后，会触发检查命中率，发现命中率太低了，所以PTRC自动失效了，所以可以看到miss列里只有200条。

MariaDB的测试样例和结果请参考：https://mariadb.com/kb/en/subquery-cache/#performance-impact。

PTRC对于参数化的重复扫描都可以进行适配，只要命中率足够，就可以加速执行。对于查询中的多种算子包括Correlated Subquery, Nested Loop Join, Semijoin, Antijoin都有加速作用。PTRC已经正式上线，欢迎大家使用。

点击关注，第一时间了解华为云新鲜技术~

文章推荐：屠榜多目标跟踪！BoT-SORT：稳健的关联多行人跟踪

mustache {{{partial}}} 与 {{>partial}}
我的 node.js 应用程序中有一个 Handlebars / mustache 布局文件，如下所示: {{> header}} {{> navbar}} {{{body}}} {{> footer
mustache {{{partial}}} 与 {{>partial}}
我的 node.js 应用程序中有一个 Handlebars / mustache 布局文件，如下所示: {{> header}} {{> navbar}} {{{body}}} {{> footer
html - rails : render partial partially
我有一个主文件，home.html.erb在里面我渲染了大约 15 个部分。这些部分非常小，我想知道是否可以将它们全部放在一个文件中，然后部分地呈现部分部分。例如，我会制作 _big_partial
typescript - 如何在 typescript 中选择性地从一个 Partial 分配到另一个 Partial
在下面的 TypeScript 代码片段中，我需要从一个对象分配给另一个对象，其中它们都是 Partial .在这里，我的直觉是 typescript 应该能够理解正在发生的事情，因为在第 (B) 行
javascript - rails : hide/close a rendered partial through a button in that partial
在我的应用程序中，用户通过 AJAX 呈现 _show.html.erb 部分。我现在想要的是在该部分中有一个按钮，单击时将其关闭。我遇到的问题:如果我将按钮放在部分之外，一切都会正常 - 我可以
clojure - 在 Clojure 中解释 `(apply partial partial args)`？
我有人造 curry Programming Clojure书。 user=> (defn faux-curry [& args] (apply partial partial args)) #'us
javascript - rails 5 : render partial in another partial with AJAX
我在尝试实现 AJAX 时遇到了一些困难，其中“link_to” View 被渲染，并且在该 View 中我有另一个 AJAX 调用。我有菜单侧边栏，其中有这样的内容: "> 在applicatio
asp.net-mvc - partial 和 render partial view 有什么区别？
我是 asp.net MVC 的新手，请告诉我应该在何处使用局部 View 以及在何处渲染局部 View 。提前致谢最佳答案 This link might help. Html.RenderPar
javascript - rails : updating partial dosen't execute inline javascript from the partial
我在下拉菜单的 Onchange 事件上更新 DIV 元素。而我正在使用partial 来替换DIV 中的内容。这是我的 ajax 调用: var cach_this = this;
javascript - AngularJS UI-路由器 : Rendering parent partial with child partial
我正在使用 UI-Router AngularJS 的框架，以呈现嵌套的部分。我在渲染父部分及其子部分时遇到问题。这是我的代码: window.app.config(['$stateProvider'
Can you get a Rails partial's name from within the partial?(您能从Partial中获取Rails Partial的名称吗？)
是否存在包含可从Partial中访问的Partial名称的变量？。在_foo.haml中：
javascript - rails 5 : refresh partial in another partial with AJAX update action
我有/views/layouts/_navigation.html.erb，其中生成了部分用户配置文件:
ruby-on-rails - rails : Render collection partial: Getting size of collection inside partial
我有一组我想用部分渲染的项目: @items = ['a','b','c'] @items, :partial => 'item' %> 我想用升序对元素进行编号。所以输出应该是: 3: a 2:
c# - MVC1000 使用 IHtmlHelper.Partial 可能会导致应用程序死锁。考虑使用标签助手或 IHtmlHelper.PartialAsync
尝试使用 .Netcore 制作 Web 应用程序当我运行该应用程序时，出现此错误。帮我这不是错误而是警告。但帮我解决我在下面添加了我的代码 @ViewBag.Title
javascript - rails 5 : Trying to render divs with a single partial but keep the div class unique so that JQuery doesn't fire on all partials
标题有点令人困惑。我正在尝试实现一些类似 reddit 的评论系统。这样您就可以查看 Post 并向其添加多态的 Comment 。或者，评论另一条评论。我的观点是这样的: Post:
partial - 只有部分图知识的寻路算法
我需要编写一个算法来引导机器人穿过“迷宫”(一个有起点、目标、空白区域和不可穿越的空间或“墙壁”的矩形网格)。它可以在任何基本方向(N、NW、W、SW、S、SE、E、NE)上移动，每次移动的成本不变。
r - R中sort函数的参数“partial”
?sort指出partial参数可以是NULL或用于部分排序的索引向量。我试过了： x <- c(1,3,5,2,4,6,7,9,8,10) sort(x) ## [1] 1 2 3 4
javascript - MVC4如何在javascript中将值传递给Html.Partial？
MVC4，单击下拉项时，JavaScript 函数在 View 的“脚本”部分中调用。函数对 Controller Action 进行ajax调用，返回Json数据。我需要将一些返回值传递给 Html
自动映射器 : partial mapping
我正在使用 Automapper 将数据从 objectA 传输到 objectB classe ObjectA { string Title; string Summary; } cla
svn - 有没有办法在TortoiseSVN中提交文件 "partially"？
我想使用 TortoiseSVN 提交文件的一部分，有什么方法可以做到这一点吗？我将举一个例子来更清楚地说明我为什么要这样做。我有一个文件，其中包含一些在构建过程中被替换的定义，如下所示: #de

知者

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城