gpt4 book ai didi

haskell - GHC:对于具有固定值的调用,是否有一致的内存规则?

转载 作者:行者123 更新时间:2023-12-04 02:11:15 25 4
gpt4 key购买 nike

在我寻求理解和利用 GHC 自动内存的过程中,我碰壁了:当使用固定值(如 fib 42)调用纯函数时, 再次调用时它们有时快有时慢。如果它们被简单地称为 fib 42,它会有所不同或通过一些数学隐含地,例如(\x -> fib (x - 1)) 43 .这些案例似乎没有韵律或理由,所以我将呈现它们的目的是询问行为背后的逻辑是什么。

考虑一个缓慢的 Fibonacci 实现,这使得 memoization 工作时很明显:

slow_fib :: Int -> Integer
slow_fib n = if n < 2 then 1 else (slow_fib (n - 1)) + (slow_fib (n - 2))

我测试了三个基本问题,看看 GHC(8.2.2 版)是否会内存带有固定参数的调用:
  • 可以slow_fib访问以前对 slow_fib 的顶级调用?
  • 之前的结果是否为后来的非平凡(例如数学)顶级表达式而内存?
  • 是否为以后相同的顶级表达式记住了以前的结果?

  • 答案似乎是:
  • 没有
  • 没有
  • 是 [??]

  • 最后一个案例有效的事实让我非常困惑:例如,如果我可以重新打印结果,那么我应该期望能够添加它们。这是显示这一点的代码:
    main = do
    -- 1. all three of these are slow, even though `slow_fib 37` is
    -- just the sum of the other two results. Definitely no memoization.
    putStrLn $ show $ slow_fib 35
    putStrLn $ show $ slow_fib 36
    putStrLn $ show $ slow_fib 37

    -- 2. also slow, definitely no memoization as well.
    putStrLn $ show $ (slow_fib 35) + (slow_fib 36) + (slow_fib 37)
    putStrLn $ show $ (slow_fib 35) + 1

    -- 3. all three of these are instant. Huh?
    putStrLn $ show $ slow_fib 35
    putStrLn $ show $ slow_fib 36
    putStrLn $ show $ slow_fib 37

    然而更奇怪的是,当结果嵌入到递归函数中时,对结果进行数学运算:这个从 Fib(40) 开始的斐波那契变体:
    let fib_plus_40 n = if n <= 0
    then slow_fib 40
    else (fib_plus_40 (n - 1)) + (fib_plus_40 (n - 2))

    如下图所示:
    main = do
    -- slow as expected
    putStrLn $ show $ fib_plus_40 0

    -- instant. Why?!
    putStrLn $ show $ fib_plus_40 1

    在 GHC 记忆化的任何解释中,我都找不到任何理由,这通常会导致显式变量(例如 herehereand here )。这就是为什么我期望 fib_plus_40记不住。

    最佳答案

    为了详细说明,以防@amalloy 的回答不清楚,问题是你在这里混淆了两件事——隐式的类似内存的行为(人们在谈论 Haskell 的“自动内存”时的意思,尽管它不是真正的内存!),它直接来自基于 thunk 的惰性求值,以及一种编译器优化技术,它基本上是一种常见的子表达式消除形式。前者或多或少是可以预见的;后者是编译器的心血来潮。

    回想一下,真正的内存是函数实现的一个属性:函数“记住”为某些参数组合计算的结果,并且可以重用这些结果,而不是在使用相同的参数多次调用时从头开始重新计算它们。当 GHC 为函数生成代码时,它 自动生成代码来执行这种内存。

    相反,生成 GHC 代码以实现函数 申请是不寻常的。不是将函数实际应用于参数以将最终结果生成为值,而是立即以 thunk 的形式构造“结果”,您可以将其视为暂停的函数调用或“ promise ”以在稍后。

    当在 future 某个时间点需要实际值时,将强制执行 thunk(这实际上会导致发生原始函数调用),并使用该值更新 thunk。如果稍后再次需要相同的值,则该值已经可用,因此不需要再次强制执行 thunk。这就是“自动内存”。请注意,它发生在“结果”级别而不是“功能”级别——功能应用程序的结果会记住它的值;一个函数不记得它之前产生的结果。

    现在,通常是 的概念。结果记住它的值的函数应用程序是 absurd 的。在严格的语言中,我们不担心在 x = sqrt(10) 之后, 重用 x会导致多个 sqrt打电话是因为 x还没有“记住”自己的值(value)。也就是说,在严格的语言中,所有函数应用程序的结果都是“自动内存”的,就像在 Haskell 中一样。

    不同之处在于惰性评估,它允许我们编写如下内容:

    stuff = map expensiveComputation [1..10000]

    它立即返回一个 thunk 而不执行任何昂贵的计算。然后:
    f n = stuff !! n

    神奇地创建了一个内存函数,而不是因为 GHC 在 f 的实现中生成代码以某种方式记住通话 f 1000 , 但因为 f 1000强制(一堆列表构造函数然后)单个 expensiveComputation其返回值被“内存”为列表 stuff 中索引 1000 处的值-- 这是一个重击,但在被强制之后,它会记住自己的值,就像严格语言中的任何值一样。

    因此,鉴于您对 slow_fib 的定义, 你的例子都没有实际上是在使用人们通常意义上的 Haskell 的自动内存功能。您看到的任何加速都是各种编译器优化的结果,这些优化是(或不是)识别常见的子表达式或内联/展开短循环。

    写一个备忘录 fib ,你需要像在严格的语言中那样明确地做到这一点,通过创建一个数据结构来保存内存值,尽管惰性求值和相互递归定义有时会使它看起来像是“自动的”:
    import qualified Data.Vector as V
    import Data.Vector (Vector,(!))

    fibv :: Vector Integer
    fibv = V.generate 1000000 getfib
    where getfib 0 = 1
    getfib 1 = 1
    getfib i = fibv ! (i-1) + fibv ! (i-2)

    fib :: Int -> Integer
    fib n = fibv ! n

    关于haskell - GHC:对于具有固定值的调用,是否有一致的内存规则?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57000994/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com