- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试优化 PostgreSQL 9.1.2 中的复杂查询,它会调用一些函数。这些函数被标记为 STABLE 或 IMMUTABLE,并在查询中使用相同的参数多次调用。我假设 PostgreSQL 足够聪明,只为每组输入调用一次它们——毕竟,这就是 STABLE 和 IMMUTABLE 的意义所在,不是吗?但似乎这些函数被多次调用。我写了一个简单的函数来测试这一点,这证实了这一点:
CREATE OR REPLACE FUNCTION test_multi_calls1(one integer)
RETURNS integer
AS $BODY$
BEGIN
RAISE NOTICE 'Called with %', one;
RETURN one;
END;
$BODY$ LANGUAGE plpgsql IMMUTABLE;
WITH data AS
(
SELECT 10 AS num
UNION ALL SELECT 10
UNION ALL SELECT 20
)
SELECT test_multi_calls1(num)
FROM data;
输出:
NOTICE: Called with 10
NOTICE: Called with 10
NOTICE: Called with 20
为什么会这样,我怎样才能让它只执行一次函数?
最佳答案
您的测试代码的以下扩展提供了信息:
CREATE OR REPLACE FUNCTION test_multi_calls1(one integer)
RETURNS integer
AS $BODY$
BEGIN
RAISE NOTICE 'Immutable called with %', one;
RETURN one;
END;
$BODY$ LANGUAGE plpgsql IMMUTABLE;
CREATE OR REPLACE FUNCTION test_multi_calls2(one integer)
RETURNS integer
AS $BODY$
BEGIN
RAISE NOTICE 'Volatile called with %', one;
RETURN one;
END;
$BODY$ LANGUAGE plpgsql VOLATILE;
WITH data AS
(
SELECT 10 AS num
UNION ALL SELECT 10
UNION ALL SELECT 20
)
SELECT test_multi_calls1(num)
FROM data
where test_multi_calls2(40) = 40
and test_multi_calls1(30) = 30
输出:
NOTICE: Immutable called with 30
NOTICE: Volatile called with 40
NOTICE: Immutable called with 10
NOTICE: Volatile called with 40
NOTICE: Immutable called with 10
NOTICE: Volatile called with 40
NOTICE: Immutable called with 20
在这里我们可以看到,在 select-list 中,不可变函数被调用了多次,在 where 子句中它被调用了一次,而 volatile 被调用了三次。
重要的不是 PostgreSQL 只会使用相同的数据调用一次 STABLE
或 IMMUTABLE
函数 - 您的示例清楚地表明情况并非如此 -它可能只调用一次。或者它可能会在必须调用 volatile 版本 50 次时调用它两次,依此类推。
利用稳定性和不变性的方式有多种,成本和 yield 也各不相同。为了提供您建议它应该使用选择列表进行的保存,它必须缓存结果,然后在返回缓存结果或调用缓存函数之前在此缓存中查找每个参数(或参数列表) -错过。这将比调用您的函数更昂贵,即使在缓存命中率很高的情况下也是如此(缓存命中率可能为 0%,这意味着这种“优化”做了额外的工作而完全没有 yield )。它可能只存储最后一个参数和结果,但同样可能完全没有用。
考虑到稳定和不可变函数通常是最轻量级的函数,这一点尤其重要。
然而,对于 where 子句,test_multi_calls1
的不变性允许 PostgreSQL 根据给定的 SQL 的简单含义实际重构查询:
For every row calculate test_multi_calls1(30) and if the result is equal to 30 continue processing the row in question
完全不同的查询计划:
Calculate test_multi_calls1(30) and if it is equal to 30 then continue with the query otherwise return a zero row result-set without any further calculation
这是 PostgreSQL 对 STABLE 和 IMMUTABLE 的一种使用——不是缓存结果,而是将查询重写为不同的查询,这些查询效率更高但给出相同的结果。
另请注意,test_multi_calls1(30) 在 test_multi_calls2(40) 之前被调用,无论它们在 where 子句中出现的顺序如何。这意味着,如果第一次调用没有返回任何行(将 = 30
替换为 = 31
进行测试),则 volatile 函数根本不会被调用 - 再次无论哪个在 和
的哪一边。
这种特殊类型的重写取决于不变性或稳定性。使用 where test_multi_calls1(30) != num
查询重写将发生在不可变的情况下,而不仅仅是稳定的功能。使用 where test_multi_calls1(num) != 30
它根本不会发生(多次调用),尽管还有其他可能的优化:
仅包含 STABLE 和 IMMUTABLE 函数的表达式可用于索引扫描。包含 VOLATILE 函数的表达式不能。调用次数可能会减少,也可能不会减少,但更重要的是,调用的结果将在查询的其余部分以更有效的方式使用(仅在大型表上才真正重要,但它可以产生大量区别)。
总而言之,不要从内存的角度来考虑波动率类别,而是要让 PostgreSQL 的查询规划器有机会以逻辑上等效(相同的结果)但效率更高的方式重组整个查询。
关于performance - 为什么 PostgreSQL 多次调用我的 STABLE/IMMUTABLE 函数?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8529690/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!