haskell - 避免多次列表遍历的好处-6ren

haskell - 避免多次列表遍历的好处

转载作者：行者123 更新时间：2023-12-02 23:30:45

25

4

我在函数式语言中看到过许多关于处理列表并构造函数以在接收到一些附加值(通常在生成函数时不存在)后对其元素执行某些操作的示例，例如:

Calculating the difference between each element and the average
(“惰性求值”下的最后 2 个示例)
以严格的函数语言(例如 ML/OCaml、to avoid traversing the first list more than once)暂存列表追加
(标题为“分期”的部分)

使用foldr将一个列表与另一个列表进行比较(即生成一个函数来将另一个列表与第一个列表进行比较)

listEq a b = foldr comb null a b
  where comb x frec [] = False
        comb x frec (e:es) = x == e && frec es
cmp1To10 = listEq [1..10]

在所有这些示例中，作者通常都提到了仅遍历原始列表一次的好处。但我无法阻止自己思考“当然，你不是遍历 N 个元素的列表，而是遍历 N 个评估的链，那又怎样？”。我知道它一定有一些好处，有人可以解释一下吗？

<小时/>

编辑:感谢两位的回答。不幸的是，这不是我想知道的。我将尝试澄清我的问题，这样它就不会与有关创建中间列表的(更常见的)问题(我已经在各个地方读到过)相混淆。也感谢您纠正我的帖子格式。

我对构建一个应用于列表的函数的情况感兴趣，在这种情况下，您还没有评估结果的必要值(无论是否是列表)。那么你就无法避免生成对每个列表元素的引用(即使列表结构不再被引用)。并且您具有与以前相同的内存访问权限，但不必解构列表(模式匹配)。

例如，请参阅上述 ML 书中的“staging”章节。我在 ML 和 Racket 中尝试过，更具体地说是“append”的分阶段版本，它遍历第一个列表并返回一个函数以在尾部插入第二个列表，而无需多次遍历第一个列表。令我惊讶的是，即使考虑到它仍然必须复制列表结构，因为每种情况下的最后一个指针都不同，但它的速度要快得多。

以下是map的一个变体，应用于列表后，更改功能时应该会更快。由于 Haskell 并不严格，我必须强制对 cachedList 中的 listMap [1..100000] 进行评估(或者可能不会，因为在第一个应用程序之后，它仍然应该存在于内存中)。

listMap = foldr comb (const [])
  where comb x rest = \f -> f x : rest f

cachedList = listMap [1..100000]
doubles = cachedList (2*)
squares = cachedList (\x -> x*x)

-- print doubles and squares
-- ...

我知道在 Haskell 中，使用 comb xrest f = ... 与 comb xrest =\f 没有什么区别(如果我错了，请纠正我) -> ...，但我选择这个版本是为了强调这个想法。

更新:经过一些简单的测试，我在 Haskell 中没有发现执行时间有任何差异。那么问题只是关于严格的语言，例如Scheme(至少是我测试过的Racket实现)和ML。

最佳答案

基本上，在循环体中执行一些额外的算术指令比执行一些额外的内存读取要便宜。

遍历意味着进行大量的内存访问，所以做的越少越好。融合遍历可减少内存流量，并增加直线计算负载，从而获得更好的性能。

具体来说，考虑这个程序来计算列表上的一些数学:

go :: [Int] -> [Int]
go = map (+2) . map (^3)

显然，我们通过两次遍历列表来设计它。在第一次和第二次遍历之间，结果被存储在中间数据结构中。然而，它是一个惰性结构，因此只消耗 O(1) 内存。

现在，Haskell 编译器立即将两个循环融合为:

go = map ((+2) . (^3))

这是为什么呢？毕竟，两者的复杂度都是O(n)，对吧？区别在于常数因子。

考虑这个抽象:对于第一个管道的每个步骤，我们执行以下操作:

  i <- read memory          -- cost M
  j = i ^ 3                 -- cost A
  write memory j            -- cost M
  k <- read memory          -- cost M
  l = k + 2                 -- cost A
  write memory l            -- cost M

因此我们支付 4 次内存访问和 2 次算术运算。

对于融合结果，我们有:

  i <- read memory          -- cost M
  j = (i ^ 3) + 2           -- cost 2A
  write memory j            -- cost M

其中 A 和 M 是对 ALU 和内存访问进行数学计算的常数因子。

还有其他常数因子(两个循环分支)而不是一个。

因此，除非内存访问是免费的(从长远来看，它不是免费的)，否则第二个版本总是更快。

请注意，对不可变序列进行操作的编译器可以实现数组融合，即为您执行此操作的转换。 GHC就是这样一个编译器。

关于haskell - 避免多次列表遍历的好处，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13686926/

25

4

0

文章推荐： vba - 为单元格位置创建变量

文章推荐： plugins - 如何制作一个chrome插件

文章推荐： java - 如何使用 apache poi 将数据写入现有 Excel

文章推荐： math - 如何命名范围为 0.0 到 1.0 的值？

haskell - Haskell 和类 Haskell 语言之间的类型声明语法差异
在 Haskell 中，类型声明使用双冒号，即 (::)，如 not::Bool -> Bool。但是在许多语法与 Haskell 类似的语言中，例如榆树、 Agda 、他们使用单个冒号(:)来声明
haskell - 在模板 haskell 中运行模板 haskell
insertST :: StateDecoder -> SomeState -> Update SomeState SomeThing insertST stDecoder st = ... Stat
haskell - 在 Haskell ("second order Haskell"中生成 Haskell 类型的工具？
如果这个问题有点含糊，请提前道歉。这是一些周末白日梦的结果。借助 Haskell 出色的类型系统，将数学(尤其是代数)结构表达为类型类是非常令人愉快的。我的意思是，看看 numeric-prelud
haskell - 如何仅使用 Haskell 无休止地运行 Haskell 程序？
我有需要每 5 分钟执行一次的小程序。目前，我有执行该任务的 shell 脚本，但我想通过 CLI 中的键为用户提供无需其他脚本即可运行它的能力。实现这一目标的最佳方法是什么？最佳答案我想你会
haskell - 需要以真实世界 Haskell 风格解决哪些 Haskell 主题？
RWH 面世已经有一段时间了(将近 3 年)。在在线跟踪这本书的渐进式写作之后，我渴望获得我的副本(我认为这是写书的最佳方式之一。)在所有相当学术性的论文中，作为一个 haskell 学生，读起来多么
haskell - 用 Haskell 编写 Haskell 解释器
一个经典的编程练习是用 Lisp/Scheme 编写一个 Lisp/Scheme 解释器。可以利用完整语言的力量来为该语言的子集生成解释器。 Haskell 有类似的练习吗？我想使用 Haskell
haskell - Haskell 中的仿函数定义及其在 Learn You a Haskell 中的解释令人困惑
以下摘自' Learn You a Haskell ' 表示 f 在函数中用作“值的类型”。这是什么意思？即“值的类型”是什么意思？ Int 是“值的类型”，对吗？但是 Maybe 不是“值的类型”
haskell - haskell 中有包含字符串和列表的类型吗？
现在我正在尝试创建一个基本函数，用于删除句子中的所有空格或逗号。 stringToIntList :: [Char] -> [Char] stringToIntList inpt = [ a | a
haskell - 案例中的模式匹配，Haskell
我是 Haskell 的新手，对模式匹配有疑问。这是代码的高度简化版本: data Value = MyBool Bool | MyInt Integer codeDuplicate1 :: Valu
haskell - Haskell 中的这个仿函数是什么意思？
如何解释这个表达式？ :t (+) (+3) (*100) 自和具有相同的优先级并且是左结合的。我认为这与 ((+) (+3)) (*100) 相同.但是，我不知道它的作用。在 Learn
haskell - Haskell 如何计算表达式
这怎么行 > (* 30) 4 120 但这不是 > * 30 40 error: parse error on input ‘*’ 最佳答案 (* 30) 是一个 section，它仍然将 * 视为
haskell - 删除满足谓词的第一个元素(Haskell)
我想创建一个函数，删除满足第二个参数中给定谓词的第一个元素。像这样: removeFirst "abab" ( 'b') = "abab" removeFirst [1,2,3,4] even =
haskell - Haskell 中的内存
Context : def fib(n): if n aand returns a memoized version of the same function. The trick is t
haskell - 惰性评估和严格评估 Haskell
我明白惰性求值是什么，它是如何工作的以及它有什么优势，但是你能解释一下 Haskell 中什么是严格求值吗？我似乎找不到太多关于它的信息，因为惰性评估是最著名的。他们各自的优势是什么。什么时候真正使
haskell - Haskell 中的反向函数行为
digits :: Int -> [Int] digits n = reverse (x) where x | n digits 1234 = [3,1,2,4]
haskell - Haskell 是否支持类型类的匿名实例？
我在 F# 中有以下代码(来自一本书) open System.Collections.Generic type Table = abstract Item : 'T -> 'U with ge
haskell - 使用需要多个输入的过滤器 - Haskell
我对 Haskell 比较陌生，过去几周一直在尝试学习它，但一直停留在过滤器和谓词上，我希望能得到帮助以帮助理解。我遇到了一个问题，我有一个元组列表。每个元组包含一个 (songName, song
haskell - 或采用两个值参数 haskell
我是 haskell 的初学者，我试图为埃拉托色尼筛法定义一个简单的函数，但它说错误: • Couldn't match expected type ‘Bool -> Bool’
haskell - Haskell 中的读取函数
我是 Haskell 语言的新手，我在使用 read 函数时遇到了一些问题。准确地说，我的理解是: read "8.2" + 3.8 应该返回 12.0，因为我们希望返回与第二个成员相同的类型。我真正
haskell - Haskell 声明中的感叹号是什么意思？
当我尝试使用真实项目来驱动它来学习 Haskell 时，我遇到了以下定义。我不明白每个参数前面的感叹号是什么意思，我的书上好像也没有提到。 data MidiMessage = MidiMessage

首页

博学

6Ren·AI

商城

haskell - 避免多次列表遍历的好处