performance - Haskell Foldl' 性能不佳 (++)-6ren

performance - Haskell Foldl' 性能不佳 (++)

转载作者：行者123 更新时间：2023-12-03 06:14:13

26

4

我有这个代码:

import Data.List

newList_bad  lst = foldl' (\acc x -> acc ++ [x*2]) [] lst
newList_good lst = foldl' (\acc x -> x*2 : acc) [] lst

这些函数返回每个元素乘以 2 的列表:

*Main> newList_bad [1..10]
[2,4,6,8,10,12,14,16,18,20]
*Main> newList_good [1..10]
[20,18,16,14,12,10,8,6,4,2]

在 ghci 中:

*Main> sum $ newList_bad [1..15000]
225015000
(5.24 secs, 4767099960 bytes)
*Main> sum $ newList_good [1..15000]
225015000
(0.03 secs, 3190716 bytes)

为什么newList_bad函数的运行速度比newList_good慢200倍？我知道这对于该任务来说不是一个好的解决方案。但为什么这个无辜的代码运行得这么慢？

这个“4767099960字节”是什么？？对于这个简单的操作，Haskell 使用了 4 GiB？

编译后:

C:\1>ghc -O --make test.hs
C:\1>test.exe
225015000
Time for sum (newList_bad [1..15000]) is 4.445889s
225015000
Time for sum (newList_good [1..15000]) is 0.0025005s

最佳答案

关于这个问题有很多困惑。通常给出的原因是“在列表末尾重复附加需要重复遍历列表，因此是O(n^2)”。但在严格评估下，事情才会这么简单。在惰性求值下，一切都应该被延迟，因此这就引出了一个问题:是否真的存在这些重复的遍历和附加。末尾的添加是由前面的消费触发的，并且由于我们在前面消费，列表变得越来越短，因此这些操作的确切时间还不清楚。因此，真正的答案更加微妙，并处理惰性求值下的具体缩减步骤。

直接的罪魁祸首是 foldl' 仅强制其累加器参数为弱头范式 - 即直到公开非严格构造函数为止。这里涉及到的函数有

(a:b)++c = a:(b++c)    -- does nothing with 'b', only pulls 'a' up
[]++c = c              -- so '++' only forces 1st elt from its left arg

foldl' f z [] = z
foldl' f z (x:xs) = let w=f z x in w `seq` foldl' f w xs

sum xs = sum_ xs 0     -- forces elts fom its arg one by one
sum_ [] a = a
sum_ (x:xs) a = sum_ xs (a+x)

因此实际的归约序列是(使用g = Foldl' f)

sum $ foldl' (\acc x-> acc++[x^2]) []          [a,b,c,d,e]
sum $ g  []                                    [a,b,c,d,e]
      g  [a^2]                                   [b,c,d,e]
      g  (a^2:([]++[b^2]))                         [c,d,e]
      g  (a^2:(([]++[b^2])++[c^2]))                  [d,e]
      g  (a^2:((([]++[b^2])++[c^2])++[d^2]))           [e]
      g  (a^2:(((([]++[b^2])++[c^2])++[d^2])++[e^2]))   []
sum $ (a^2:(((([]++[b^2])++[c^2])++[d^2])++[e^2]))

请注意，到目前为止我们只执行了 O(n) 步骤。 a^2 可立即用于 sum 的消耗，但 b^2 则不然。 我们只剩下 ++ 表达式的左嵌套结构。其余部分在 this answer by Daniel Fischer 中得到了最好的解释。。其要点是，要获取 b^2 ，必须执行 O(n-1) 步骤 - 并且在该访问之后留下结构仍将是左嵌套的，因此下一次访问将采取 O(n-2) 步骤，依此类推 - 经典的 O(n^2) 行为。所以真正的原因是 ++ 没有强制或重新排列其参数以提高效率。

这实际上是违反直觉的。我们可以期望惰性求值能够神奇地为我们“做这件事”。毕竟，我们只是表达了将来将 [x^2] 添加到列表末尾的意图，我们实际上并没有立即执行此操作。所以这里的时机不对，但它可以是正确的 - 当我们访问列表时，如果时机正确，新元素将被添加到列表中并立即消耗: if c ^2 将被添加到列表中 b^2 之后(空间方面)，例如，就在(时间上)之前 b^2 将被消耗，遍历/访问将始终是 O(1)。

这是通过所谓的“差异列表”技术实现的:

newlist_dl lst = foldl' (\z x-> (z . (x^2 :)) ) id lst

如果您想一下，它看起来与您的 ++[x^2] 版本完全相同。它表达了相同的意图，并且也留下了左嵌套结构。

正如 Daniel Fischer 在同一答案中所解释的那样，区别在于(.) 链在第一次强制时，会重新排列自身 以 O(n) 步骤进入右嵌套 ($) 结构¹，之后每次访问是 O(1) 并且附加的时间是最佳的，正如上一段所述，因此我们剩下总体 O(n) 行为。

<小时/>

¹ 这有点神奇，但它确实发生了。 :)

关于performance - Haskell Foldl' 性能不佳 (++)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/14938584/

26

4

0

文章推荐： linq-to-sql - 具有类型安全整数类的 LINQ To SQL

文章推荐： haskell - 如何使用堆栈安装包？

文章推荐： apache-flex - 弹性3 : How Can I Work on a Copy of a Project?

performance - "performant"软件究竟是什么意思？
关闭。这个问题是opinion-based .它目前不接受答案。想改善这个问题吗？更新问题，以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
performance - 灿灿授权: Performance Issue
暂时忘记能力的定义，只关注能力的“检查”(使用“授权!”)，我看到 CanCan 添加了大约 400 毫秒，用于简单地检查用户是否具有特定的能力主题/模型。这是预期的吗(我假设不是)？或者，有没有可
performance - Swift 显式与推断类型 : Performance
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start )，它预定义为不显式设置类型，因
performance - 编码优先级 : Performance, 可维护性、可重用性？
这主要是由于对 SQL 问题的回答。由于性能原因，有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然，但代码必须工作。性能永远是第一位的吗？提供了许多以性能为主要优先事项的答
performance - Scala递归与循环: performance and runtime considerations
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的，非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
performance - ui-performance 插件无法在开发模式下工作 (Grails)
我已将 ui-performance 插件应用到我的应用程序中。不幸的是，在开发模式下运行应用程序时它似乎不起作用。例如，我的 javascript 导入是用“vnull”版本呈现的。例如不会
performance - 编译 F# 引用 : performance?
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价；现在我使用了 F# PowerPack，它提供了将引用转换为表达式树和委托(delegate)的方法
performance - Spark独立: SparklyR : Performance issues
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
performance - 架构和索引以及主键 : Differences in lookup performance?
我有一个数据库(准确地说是在 postgres 上运行)，具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
performance - iOS/核心动画 : Performance tuning
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下？它基本上是一个轮子(派生自 UIView)，包含 12 个按钮(派生自 UIControl)。
performance - coursera progfun1 : scala union performance
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时，我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
performance - Symfony2 依赖注入(inject) : performances impact
我正在重构我的一个 Controller 以使其成为一项服务，我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。这样效率更高吗: innova.path.
performance - facelet tag performance
我有一个要显示的内容很大的文件。例如在显示用户配置文件时，中的每个 EL 表达式需要一个 userId 作为 bean 的参数，该参数取自 session 上下文。我在 xhtml 文件中将这个 u
performance - OpenGL/DirectX : How does Mipmapping improve performance?
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前，驱动程序不知道要访问哪个 mipmap
performance - Scala 惰性值 : performance penalty? 线程安全？
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
java - build().perform() 和 Perform() 之间有什么区别
一些文章建议现在 build() 包含在 perform() 本身中，而其他人则建议当要链接多个操作时使用 build().perform()一起。最佳答案 build() 包含在 perform(
performance - postgres 函数 : when does IMMUTABLE hurt performance?
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
performance - 零成本抽象 : performance of for-loop vs. 迭代器
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
performance - MQ : CPU Performance 上的 SSL
我想在 MQ 服务器上部署 SSL，但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2，
performance - Chrome Performance Profiler 中的“Timings”选项卡丢失
因此，我在 Chrome 开发者工具的性能选项卡内的时间部分成功地监控了我的 React Native 应用程序的性能。突然在应用程序的特定重新加载时，Timings 标签丢失。我已尝试重置

首页

博学

6Ren·AI

商城

performance - Haskell Foldl' 性能不佳 (++)