postgresql - 为什么在 LOOP 中捕获错误会导致性能问题？-6ren

postgresql - 为什么在 LOOP 中捕获错误会导致性能问题？

转载作者：行者123 更新时间：2023-11-29 12:17:20

25

4

我的函数存在性能问题:

totalCharge := 0;
FOR myRecord IN ... LOOP
    ......
    IF severalConditionsAreMet THEN
        BEGIN

            SELECT t1.charge INTO STRICT recordCharge
            FROM t1
            WHERE t1.id = myRecord.id AND otherComplexConditionsHere;

            totalCharge := totalCharge + recordCharge;

            ...........
        EXCEPTION
             WHEN OTHERS THEN 
                 NULL;
        END;
    END IF;

END LOOP;

该函数被调用了 232 次(不计算来自 FOR 的代码被访问的次数)。来自 FOR 循环的 IF 最终被访问了 4466 次，并花费了 561 秒来完成所有 4466 次迭代。

对于我拥有的特定数据集，IF 总是被访问，上面的 SELECT 从不返回数据，代码每次都到达 EXCEPTION 分支。我已将代码更改为:

totalCharge := 0;
FOR myRecord IN ... LOOP
    ......
    IF severalConditionsAreMet THEN

        SELECT t1.charge INTO recordCharge
        FROM t1
        WHERE t1.id = myRecord.id AND otherComplexConditionsHere;

        IF (recordCharge IS NULL) THEN
            CONTINUE;
        END IF;

        totalCharge := totalCharge + recordCharge;

        ...........

    END IF;

END LOOP;

请注意，对于表 t1，t1.charge 列定义了 NOT NULL 条件。这一次，来自 IF 的代码需要 1-2 秒才能完成所有 4466 次迭代。

基本上，我所做的就是替换

BEGIN
…
EXCEPTION
….
END;

与

IF conditionIsNotMet THEN
    CONTINUE;         
END IF;

有人可以向我解释为什么这有效吗？幕后发生了什么？我怀疑当您在 LOOP 中捕获异常并且代码最终生成异常时，Postgres 无法使用缓存的计划来优化该代码，因此它最终会在每次迭代中规划代码，这会导致性能问题。我的假设是否正确？

稍后编辑:

我修改了 Vao Tsun 提供的示例以反射(reflect)我想要说明的案例。

CREATE OR REPLACE FUNCTION initialVersion()
RETURNS VOID AS $$
declare
  testDate DATE;
begin
  for i in 1..999999 loop
    begin
    select now() into strict testDate where 1=0;
    exception when others 
    then null;
    end;
  end loop;
end;
$$ Language plpgsql;

CREATE OR REPLACE FUNCTION secondVersion()
RETURNS VOID AS $$
declare
    testDate DATE;
begin
  for i in 1..999999 loop
    select now() into testDate where 1=0;
    if testDate is null then 
      continue;
    end if;
  end loop;
end;
$$ Language plpgsql;

select initialVersion(); -- 19.7 seconds

select secondVersion(); -- 5.2

如您所见，相差将近 15 秒。在我最初提供的示例中，差异更大，因为 SELECT FROM t1 针对复杂数据运行并且比第二个示例中提供的简单 SELECT 花费更多的时间来执行。

最佳答案

我问了同样的问题here , 在 PostgreSQL - general mailing group 中，得到了一些回复，为我阐明了这个“谜团”:

大卫·约翰斯顿:

"Tip: A block containing an EXCEPTION clause is significantly more expensive to enter and exit than a block without one. Therefore, don't use EXCEPTION without need."

I'm somewhat doubting "plan caching" has anything to do with this; I suspect its basically that there is high memory and runtime overhead to deal with the possibilities of needing to convert a exception into a branch instead of allowing it to be fatal.

汤姆莱恩:

Yeah, it's about the overhead of setting up and ending a subtransaction. That's a fairly expensive mechanism, but we don't have anything cheaper that is able to recover from arbitrary errors.

还有 David G. Johnston 的补充:

[...] setting up the pl/pgsql execution layer to trap "arbitrary SQL-layer exceptions" is fairly expensive. Even if the user specifies specific errors the error handling mechanism in pl/pgsql is code for generic (arbitrary) errors being given to it.

这些答案帮助我了解了一些事情是如何运作的。我在这里发布这个答案是因为我希望这个答案能帮助其他人。

关于postgresql - 为什么在 LOOP 中捕获错误会导致性能问题？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46409856/

25

4

0

文章推荐： c# - Npgsql + Dapper ExecuteReader

文章推荐： mysql - 为 PDO 连接准备简单查询

文章推荐： php - 在mysql中同时向两个表插入数据

文章推荐： php - propel:数据库:创建用户 'user' @'localhost' 的访问被拒绝

loops - 好奇 Haskell 中如何评估 "loop = loop"
我认为这样的表达式会导致 Haskell 永远评估。但是 GHCi 和编译程序中的行为让我感到惊讶。例如，在 GHCi 中，这些表达式一直阻塞到 I Control+C ，但不消耗 CPU。看起来像
for-loop - 尽管我们已经有了 "for loop"或反之亦然，为什么还要创建 "while loop"？
就目前情况而言，这个问题不太适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持，但这个问题可能会引发辩论、争论、民意调查或扩展讨论。如果您觉得这个问题可以改进并可能重新开放，visit
C# If loop within a for loop within a if loop
如果可以的话，我想减少这段代码: class Alarm { internal static void isGreaterThanOrBelowValue(int min, int max,
loops - 批处理 - "for/F loop"内部 "for/L loop"
我有以下问题: 我想创建一个批处理文件，循环访问一定数量的 IP 地址，以停止远程 PC 上的某个服务。因为停止过程需要一些时间，所以我需要第二个循环来查询服务的状态并等待，直到服务达到“已停止”状
loops - loop{} 运行了两次？
我已经完整地编写了“The Rust Programming Language”在线书籍中的程序，chapter 2 .我还进一步开发了它:通过添加一个简单的问题/响应，用户可以通过输入“y”再次玩游
loops - clojure for loop，将值存储在集合或映射中
这个人已经困扰了我一阵子了，我们应该如何在集合中存储值或在for循环中映射？ (let [s #{}] (for [ i (range 10) j (range 1
loops - x86 LOOP 指令究竟是如何工作的？
mov ecx, 16 looptop: . . . loop looptop 这个循环会执行多少次？如果 ecx
for-loop - XTend For-Loop 支持和添加范围支持
我似乎无法找到一种在 Xtend 中表达以下内容而不诉诸 while 循环的好方法: for(int i = 0; i range(int stop) { range(0, stop) }
loops - x86 程序集 : Loops!
好吧，长话短说，我正在学习汇编，我正在尝试循环打印出 ascii 字符“0”-“9”。因此，我完成了我在示例中看到的所有基础知识，例如使用 pushad 和 popad 保存寄存器状态，分配堆栈空间，
javascript - 有没有办法制作 "for loop of for loops"？
我正在尝试为自己编写一个扑克计算器，我有一个 5 级深的 for 循环。为此，我将 for 循环一个接一个地嵌套。我正在寻找一种方法来简单地使用一个循环(或函数)，它可以告诉我想去多少层。对于这个例
python - for loop in for loop 的更快替代方案
我有一本包含约 150,000 个键的字典。没有重复的键。每个 key 的长度为 127 个字符，每个 key 在 1-11 个位置上有所不同(大多数差异发生在 key 的末尾)。每个键的值是一个唯一
loops - 在 (LOOP FOR A ...) 的宏扩展期间出错
我正在尝试编写一个 Lisp 程序来实现与点和方 block 非常相似的棋盘游戏，这意味着我有两个玩家相互竞争但可以连续移动。我正在尝试实现最简单的 minimax 算法来实现这一点，没有 alpha
算法时间复杂度分析(for loop with inner while loop)
下面是我实现的代码的简要说明。 for 循环的复杂度应该是 O(n)。我只是无法弄清楚内部 while 循环的时间复杂度。 int x,n; // Inputted by the user.
loops - "Infinite loop"导致无法访问的代码
我目前正在尝试使用 html 分词器 https://godoc.org/golang.org/x/net/html . 所以我想做的是:从 url 获取所有链接，如果 url 包含特定字符串 ->
shell 脚本 : for-loop within while loop
我有 32 个文件(以相同的模式命名，唯一的区别是下面写的 $sample 编号)我想分成 4 个文件夹。我正在尝试使用以下脚本来完成这项工作，但该脚本无法正常工作，有人可以帮我使用以下 shell
loops - 动态 WHERE 子句 IN LOOP AT 语句
我必须根据 where 条件在我的内部表上做一个循环，但根据我的程序模式，必须在运行时修改 where 条件的字段。我知道在 SELECT 语句中这是可能的，但是当我在循环中执行此操作时出现错误。
KDB/Q : how to loop without loops?
我正在学习关于kdb数据库的q。我担心q中没有循环。我需要写一个算法，用像C这样的冗长程序在几个嵌套的for循环中编写。但是在q中，我被无法循环的事实所困扰。仅举一个具体的例子(很多)，我有一个简
haskell - 循环 StateT : Why this loop doesn't loop
我不明白为什么这段代码只循环一次然后退出？在 Ghci 中，我只能回答第一个循环，然后似乎变量 cont 设置为 false 并且我没有提示回答。结果是: *Main> testLoop1 td1
for-loop - 在 Racket "for loop"中做两件事
我正在 Racket 中运行 for 循环，对于列表中的每个对象，我想执行两件事:如果该项目满足条件，(1) 将其附加到我的新列表中，(2) 然后打印列表。但我不知道如何在 Racket 中执行此操作
for-loop - Matlab并行工具箱: stacking loops in parfor
我正在尝试使用 matlab 并行包中的 parfor 循环。我和这个人有类似的问题:MATLAB parfor slicing issue? 。输出矩阵似乎没有被识别为切片变量。在我的具体情况下，我

首页

博学

6Ren·AI

商城

postgresql - 为什么在 LOOP 中捕获错误会导致性能问题？