- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有这个代码:
import Data.List
newList_bad lst = foldl' (\acc x -> acc ++ [x*2]) [] lst
newList_good lst = foldl' (\acc x -> x*2 : acc) [] lst
这些函数返回每个元素乘以 2 的列表:
*Main> newList_bad [1..10]
[2,4,6,8,10,12,14,16,18,20]
*Main> newList_good [1..10]
[20,18,16,14,12,10,8,6,4,2]
在 ghci 中:
*Main> sum $ newList_bad [1..15000]
225015000
(5.24 secs, 4767099960 bytes)
*Main> sum $ newList_good [1..15000]
225015000
(0.03 secs, 3190716 bytes)
为什么newList_bad
函数的运行速度比newList_good
慢200倍?我知道这对于该任务来说不是一个好的解决方案。但为什么这个无辜的代码运行得这么慢?
这个“4767099960字节”是什么??对于这个简单的操作,Haskell 使用了 4 GiB?
编译后:
C:\1>ghc -O --make test.hs
C:\1>test.exe
225015000
Time for sum (newList_bad [1..15000]) is 4.445889s
225015000
Time for sum (newList_good [1..15000]) is 0.0025005s
最佳答案
关于这个问题有很多困惑。通常给出的原因是“在列表末尾重复附加需要重复遍历列表,因此是O(n^2)
”。但在严格评估下,事情才会这么简单。在惰性求值下,一切都应该被延迟,因此这就引出了一个问题:是否真的存在这些重复的遍历和附加。末尾的添加是由前面的消费触发的,并且由于我们在前面消费,列表变得越来越短,因此这些操作的确切时间还不清楚。因此,真正的答案更加微妙,并处理惰性求值下的具体缩减步骤。
直接的罪魁祸首是 foldl'
仅强制其累加器参数为弱头范式 - 即直到公开非严格构造函数为止。这里涉及到的函数有
(a:b)++c = a:(b++c) -- does nothing with 'b', only pulls 'a' up
[]++c = c -- so '++' only forces 1st elt from its left arg
foldl' f z [] = z
foldl' f z (x:xs) = let w=f z x in w `seq` foldl' f w xs
sum xs = sum_ xs 0 -- forces elts fom its arg one by one
sum_ [] a = a
sum_ (x:xs) a = sum_ xs (a+x)
因此实际的归约序列是(使用g = Foldl' f
)
sum $ foldl' (\acc x-> acc++[x^2]) [] [a,b,c,d,e]
sum $ g [] [a,b,c,d,e]
g [a^2] [b,c,d,e]
g (a^2:([]++[b^2])) [c,d,e]
g (a^2:(([]++[b^2])++[c^2])) [d,e]
g (a^2:((([]++[b^2])++[c^2])++[d^2])) [e]
g (a^2:(((([]++[b^2])++[c^2])++[d^2])++[e^2])) []
sum $ (a^2:(((([]++[b^2])++[c^2])++[d^2])++[e^2]))
请注意,到目前为止我们只执行了 O(n)
步骤。 a^2
可立即用于 sum
的消耗,但 b^2
则不然。 我们只剩下 ++
表达式的左嵌套结构。其余部分在 this answer by Daniel Fischer 中得到了最好的解释。 。其要点是,要获取 b^2
,必须执行 O(n-1)
步骤 - 并且在该访问之后留下结构仍将是左嵌套的,因此下一次访问将采取 O(n-2)
步骤,依此类推 - 经典的 O(n^2)
行为。所以真正的原因是 ++
没有强制或重新排列其参数以提高效率。
这实际上是违反直觉的。我们可以期望惰性求值能够神奇地为我们“做这件事”。毕竟,我们只是表达了将来将 [x^2]
添加到列表末尾的意图,我们实际上并没有立即执行此操作。所以这里的时机不对,但它可以是正确的 - 当我们访问列表时,如果时机正确,新元素将被添加到列表中并立即消耗: if c ^2
将被添加到列表中 b^2
之后(空间方面),例如,就在(时间上)之前 b^2
将被消耗,遍历/访问将始终是 O(1)
。
这是通过所谓的“差异列表”技术实现的:
newlist_dl lst = foldl' (\z x-> (z . (x^2 :)) ) id lst
如果您想一下,它看起来与您的 ++[x^2]
版本完全相同。它表达了相同的意图,并且也留下了左嵌套结构。
正如 Daniel Fischer 在同一答案中所解释的那样,区别在于(.)
链在第一次强制时,会重新排列自身 以 O(n)
步骤进入右嵌套 ($)
结构1,之后每次访问是 O(1)
并且附加的时间是最佳的,正如上一段所述,因此我们剩下总体 O(n)
行为。
1 这有点神奇,但它确实发生了。 :)
关于performance - Haskell Foldl' 性能不佳 (++),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14938584/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!