postgresql - Postgres 9.6 函数与直接 sql 相比表现不佳-6ren

postgresql - Postgres 9.6 函数与直接 sql 相比表现不佳

转载作者：行者123 更新时间：2023-11-29 12:09:21

27

4

我有这个功能，它可以工作，它给出了最近的 b 记录。

create or replace function most_recent_b(the_a a) returns b as $$
    select distinct on (c.a_id) b.*
    from c 
    join b on b.c_id = c.id
    where c.a_id = the_a.id 
    order by c.a_id, b.date desc
$$ language sql stable;

这对真实数据运行约 5000 毫秒。 V.S.以下运行时间为 500 毫秒

create or replace function most_recent_b(the_a a) returns b as $$
    select distinct on (c.a_id) b.*
    from c 
    join b on b.c_id = c.id
    where c.a_id = 1347 
    order by c.a_id, b.date desc
$$ language sql stable;

唯一的区别是我用值 1347 对 a.id 进行了硬编码，而不是使用它的参数值。

同样在没有函数的情况下运行这个查询也给我大约 500 毫秒的速度

我运行的是 PostgreSQL 9.6，所以我在其他地方看到的建议的查询规划器功能失败结果不应该适用于我，对吗？

我确定问题不是查询本身，因为这是我的第三次迭代，获得此结果的不同技术都会导致在函数内部时同样变慢。

应@laurenz-albe 的要求

带有常量的 EXPLAIN (ANALYZE, BUFFERS) 的结果

Unique  (cost=60.88..60.89 rows=3 width=463) (actual time=520.117..520.122 rows=1 loops=1)
  Buffers: shared hit=14555
  ->  Sort  (cost=60.88..60.89 rows=3 width=463) (actual time=520.116..520.120 rows=9 loops=1)
        Sort Key: b.date DESC
        Sort Method: quicksort  Memory: 28kB
        Buffers: shared hit=14555
        ->  Hash Join  (cost=13.71..60.86 rows=3 width=463) (actual time=386.848..520.083 rows=9 loops=1)
              Hash Cond: (b.c_id = c.id)
              Buffers: shared hit=14555
              ->  Seq Scan on b (cost=0.00..46.38 rows=54 width=459) (actual time=25.362..519.140 rows=51 loops=1)
                    Filter: b_can_view(b.*)
                    Rows Removed by Filter: 112
                    Buffers: shared hit=14530
              ->  Hash  (cost=13.67..13.67 rows=3 width=8) (actual time=0.880..0.880 rows=10 loops=1)
                    Buckets: 1024  Batches: 1  Memory Usage: 9kB
                    Buffers: shared hit=25
                    ->  Subquery Scan on c  (cost=4.21..13.67 rows=3 width=8) (actual time=0.222..0.872 rows=10 loops=1)
                          Buffers: shared hit=25
                          ->  Bitmap Heap Scan on c c_1  (cost=4.21..13.64 rows=3 width=2276) (actual time=0.221..0.863 rows=10 loops=1)
                                Recheck Cond: (a_id = 1347)
                                Filter: c_can_view(c_1.*)
                                Heap Blocks: exact=4
                                Buffers: shared hit=25
                                ->  Bitmap Index Scan on c_a_id_c_number_idx  (cost=0.00..4.20 rows=8 width=0) (actual time=0.007..0.007 rows=10 loops=1)
                                      Index Cond: (a_id = 1347)
                                      Buffers: shared hit=1
Execution time: 520.256 ms

这是在传递参数的情况下运行六次后的结果(正好是你预测的六次:))
慢查询；

Unique  (cost=57.07..57.07 rows=1 width=463) (actual time=5040.237..5040.243 rows=1 loops=1)
  Buffers: shared hit=145325
  ->  Sort  (cost=57.07..57.07 rows=1 width=463) (actual time=5040.237..5040.240 rows=9 loops=1)
        Sort Key: b.date DESC
        Sort Method: quicksort  Memory: 28kB
        Buffers: shared hit=145325
        ->  Nested Loop  (cost=0.14..57.06 rows=1 width=463) (actual time=912.354..5040.195 rows=9 loops=1)
              Join Filter: (c.id = b.c_id)
              Rows Removed by Join Filter: 501
              Buffers: shared hit=145325
              ->  Index Scan using c_a_id_idx on c (cost=0.14..9.45 rows=1 width=2276) (actual time=0.378..1.171 rows=10 loops=1)
                    Index Cond: (a_id = $1)
                    Filter: c_can_view(c.*)
                    Buffers: shared hit=25
              ->  Seq Scan on b (cost=0.00..46.38 rows=54 width=459) (actual time=24.842..503.854 rows=51 loops=10)
                    Filter: b_can_view(b.*)
                    Rows Removed by Filter: 112
                    Buffers: shared hit=145300
Execution time: 5040.375 ms

值得注意的是，我涉及一些严格的行级安全性，我怀疑这就是为什么这些查询都很慢，但是，一个比另一个慢 10 倍。

我已经更改了我原来的表名，希望我的搜索和替换在这里是好的。

最佳答案

查询执行的昂贵部分是过滤器 b_can_view(b.*)，它必须来自您的行级安全定义。

快速执行:

Seq Scan on b (cost=0.00..46.38 rows=54 width=459)
              (actual time=25.362..519.140 rows=51 loops=1)
  Filter: b_can_view(b.*)
  Rows Removed by Filter: 112
  Buffers: shared hit=14530

执行缓慢:

Seq Scan on b (cost=0.00..46.38 rows=54 width=459)
              (actual time=24.842..503.854 rows=51 loops=10)
  Filter: b_can_view(b.*)
  Rows Removed by Filter: 112
  Buffers: shared hit=145300

区别在于在慢速情况下(loops=10)扫描执行了 10 次并且接触了 10 倍多的数据 block 。

当使用通用计划时，PostgreSQL 低估了 c 中有多少行将满足条件 c.a_id = $1，因为它不知道实际值为 1347，高于平均值。

由于 PostgreSQL 认为从 c 中最多只有一行，因此它选择了一个嵌套循环连接，并在内侧对 b 进行顺序扫描。

现在两个问题结合起来:

调用函数 b_can_view 每行花费超过 3 毫秒(PostgreSQL 不知道)，这占 163 行的顺序扫描花费的半秒。
在 c 中实际找到了 10 行，而不是预测的 1 行，因此表 b 被扫描了 10 次，最后得到一个查询持续时间5 秒。

那你能做什么呢？

告诉 PostgreSQL b_can_view 有多昂贵。使用 ALTER TABLE 将该函数的 COST 设置为 1000 或 10000 以反射(reflect)实际情况。仅凭这一点还不足以获得更快的计划，因为 PostgreSQL 认为它无论如何都必须执行单个顺序扫描，但为优化器提供正确的数据是一件好事。
在 b(c_id) 上创建索引。这将使 PostgreSQL 避免对 b 进行顺序扫描，一旦它意识到该函数的开销有多大，它就会尝试这样做。

此外，尝试使函数 b_can_view 更便宜。这将使您的体验变得更好。

关于postgresql - Postgres 9.6 函数与直接 sql 相比表现不佳，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/44904475/

27

4

0

文章推荐： php - SQL 计数大小和性别

文章推荐： java - Statement.executeQuery 的 ResultSet 不能为 null

文章推荐： php - Mysql请求缓存

haskell - .与haskell中的$相比
这个问题在这里已经有了答案: 11年前关闭。 Possible Duplicate: Haskell: difference between . (dot) and $ (dollar sign) 好
Java开发标准和工具(与C#相比)
我对 Java 平台没有任何了解，我想知道可以使用哪些工具(和方法)来帮助开发用 Java 编写的可维护代码。我知道可以使用: 适用于任何环境的敏捷方法用于单元测试代码的 jUnit/jMock(
css - 与IE10+相比，IE9不支持的所有CSS规则有没有聪明的方法？
我们的产品需要支持 IE9，但我们一直假设 IE9 支持 IE10+ CSS 规则。是否有一种巧妙的方法来获取在 IE10+ 中有效但在 IE9 中不受支持的所有 CSS 规则，目的是在静态代码分析
c++ - 重载 += 与 + 相比
我需要为 MyString 类重载运算符 + 和 +=。 MyString.h class MyString { char* m_pStr; }; 主要
java - 与 i++ 相比，执行强制转换操作的成本有多高？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
c++ - `ofstream` 与 0 相比
我正在升级现有的旧代码以使用 VS 2019*，在代码中我有以下函数在返回行失败: int foo(const char *fn) const { ofstream out(fn,ios::b
R2D3 与 D3.js 相比
我想使用 R2D3 pacakge 在 R 中，但我不确定这个包与 D3.js 库的关系。 R2D3 是否以任何方式限制 D3 的功能？我们可以将 R 中的所有 D3 功能和特性与 R2D3 一起使用
c# - 语音识别质量极差，尤其是与 Word 相比
我正在使用 WPF 语音识别库，试图在桌面应用程序中使用它来替代菜单命令。 (我想专注于没有键盘的平板电脑体验)。它可以工作 - 有点，除了识别的准确性太差以至于无法使用。所以我试着听写到 Word。
sql - SELECT FROM WHERE IN 与多个表上的 SELECT FROM 相比
我在学校参加数据库类(class)。老师给了我们一个简单的练习:考虑以下简单的模式: Table Book: Column title (primary key) Column gen
mvvm - MVVM 架构中的模型与 MVC 相比
我正在尝试学习 MVVM 模式，特别是当 View 表示数据库表时该怎么做，但 View 有几个元素表示单个数据库字段。举个简单的例子: 假设我有一个 DateTime 类型的数据库字段(每个数据库字
与具有几百万行的表上的 "<>"相比，SQL Server "="运算符非常慢
我有两张 table 。表单有约 77000 行。日志约有 270 万行。以下查询将在不到一秒的时间内返回“30198”: SELECT COUNT(DISTINCT logs.DOCID) FRO
R 中的回归(与 Eviews 相比)
当您在 Eviews 中进行回归时，您会得到一组这样的统计数据: 在 R 中有没有一种方法可以在一个列表中获得所有/大部分关于 R 回归的统计数据？最佳答案请参阅summary，它将为大多数回归对
dictionary - 与Go中的 map 相比，搜索无序数组要花多少个元素
如果我枚举 type XType int const ( X1 XType = iota X2 ... Xn ) var XTypeNames = []string{"x1", "x2
r - 与 randomForest 相比，游侠的错误预测
我正在试用 ranger R包加速做了很多randomForest计算。我正在检查我从中得到的预测，并注意到一些有趣的事情，因为所做的预测完全不正确。以下是比较 randomForest 的可重现示
clang - 与 GCC 相比，编译时间显着变慢
我发现 Clang 编译速度比 GCC 慢了四倍。知道是什么原因造成的吗？ ebg@tsuki(250)$ time /usr/bin/cc -DHC4 -DSAFETY -DNOREDUCE -DN
jquery - $.ajax 与 $.post 相比
我注意到在尝试以 JSON 格式发布表单数据时，以下内容不起作用: $.ajax({ type: "POST", url: url, data: JSON.string
c# - 与#if/#endif 相比，条件属性的缺点是什么？
我的代码库中有很多 #if DEBUG/#endif 语句，它们大多具有断言类型逻辑，我不敢在生产环境中运行这些逻辑。 [Conditional("DEBUG")] public void Check
c - 想知道何时使用 do while 循环与 while 相比(内部示例)
所以我正在开发一个平方根计算器，但我不知道 while 循环是否比 do while 循环更适合。 double x, y = 1.0, newY, squareRoot; bool
c# - 与另一个列表 LINQ 相比，检查一个列表中有哪些元素
我有两个列表，一个是所有语言，另一个是网站拥有的语言子集，我的想法是返回所有语言，但如果子集的元素对应于所有语言的列表，则更改 bool 值的属性. 语言的DTO: public class DTOL
c# - 与 winform 相比，来自控制台的过程
以下控制台应用程序运行正常 - 我很惊讶它没有出错。 class DelegateExperiments { //>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

首页

博学

6Ren·AI

商城

postgresql - Postgres 9.6 函数与直接 sql 相比表现不佳