haskell - 为什么简单地使用 State monad 会导致堆栈溢出？-6ren

haskell - 为什么简单地使用 State monad 会导致堆栈溢出？

转载作者：行者123 更新时间：2023-12-03 13:44:15

25

4

我在玩 State monad，我不知道是什么导致了这段简单的代码中的堆栈溢出。

import Control.Monad.State.Lazy

tick :: State Int Int
tick = do n <- get
         put $! (n+1)
         return n

million :: Int
million = snd $ runState (mapM_ (const tick) [1..1000000]) 0

main = print million

备注
我只想知道是什么导致了这段代码的问题，任务本身并不重要。

最佳答案

问题是 Control.Monad.State.Lazy 的 (>>=) 太懒了，甚至 ($!) 也无济于事。
试试 Control.Monad.State.Strict，它应该达到 ($!)。

惰性状态单子(monad)的 (>>=) 根本不查看 (value,state) 对，因此在到达结束之前完成一些评估的唯一方法是使用 f在 m >>= f解构这对。这不会发生在这里，所以你会得到一个巨大的 thunk，当 runState 最终想要一个结果时，这对于堆栈来说太大了。

好的，我已经吃过了，现在我可以详细说明。让我使用惰性 State s 的旧 (mtl-1.x) 定义monad，没有内部 monad 更容易看到那里。新的 (mtl-2.x) 定义 type State s = StateT s Identity行为相同，只是更多的写作和阅读。 (>>=) 的定义是

m >>= k  = State $ \s -> let
    (a, s') = runState m s
    in runState (k a) s'

现在， let绑定(bind)是惰性的，因此这是

m >>= k = State $ \s -> let
    blob = runState m s
    in runState (k $ fst blob) (snd blob)

只有更具可读性。所以 (>>=) 让 blob 完全不被评估。仅当 k 时才需要评估需要检查 fst blob确定如何继续，或 k a需要检查 snd blob .

在 replicateM r tick ，计算用 (>>) 链接，所以 k in (>>=) 的定义是 const tick .作为一个常量函数，它绝对不需要检查它的参数。所以 tick >> tick变成

State $ \s -> 
    let blob1 = (\n -> let n' = n+1 in seq n' ((),n')) s
        blob2 = (\m -> let m' = m+1 in seq m' ((),m')) (snd blob1)
    in blob2

seq直到 blobN 才被触及必须进行评估。但是需要将其评估为最外层的构造函数 - 对构造函数 (,) - 足以触发 seq，这反过来又会导致此处的完整评估。现在，在 million , 在最终的 snd 之前没有任何评估需要在 runState 之后到达了。到那时，已经构建了具有一百万层的thunk。评估该 thunk 需要推送许多 let m' = m+1 in seq m' ((),m')在堆栈上直到达到初始状态，如果堆栈大到足以容纳它们，它们就会被弹出并应用。所以这将是三个遍历，1. 构建 thunk，2. 从 thunk 中剥离层并将它们推送到堆栈上，3. 消耗堆栈。

Control.Monad.State.Strict 的 (>>=) 严格到足以强制 seq s 在每个绑定(bind)上，因此只有一次遍历，没有(非平凡的)thunk 被构建并且计算在恒定空间中运行。
定义是

m >>= k = State $ \s ->
    case runState m s of
      (a, s') -> runState (k a) s'

重要的区别是 case 中的模式匹配。表达式是严格的，这里是 blob必须对最外层的构造函数求值，以将其与 case 中的模式匹配。 .
与 m = tick = State (\m -> let m' = m+1 in seq m' ((),m'))重要的部分变成

case let s' = s+1 in seq s' ((),s') of
    (a, s'') -> runState (k a) s''

模式匹配需要评估 ((), s') [对 (,) 构造函数]，由 seq这与 s' = s+1 的评估有关，在每次绑定(bind)时都会对所有内容进行全面评估，没有 thunk，没有堆栈。

但是，您仍然需要小心。在这种情况下，由于 seq (分别为 ($!))和所涉及类型的浅层结构，评价跟上 (>>)的应用.通常，具有更深层次的结构化类型和/或没有 seq s，C.M.S.Strict 还构建可能导致堆栈溢出的大型 thunk。在这种情况下，与 C.M.S.Lazy 生成的 thunk 相比，thunk 更简单且更少纠缠。

另一方面，C.M.S.Lazy 的惰性允许 C.M.S.Strict 无法进行的其他计算。例如，C.M.S.Lazy 提供了为数不多的单子(monad)之一，其中

take 100 <$> mapM_ something [1 .. ]

终止。 [但请注意，此时状态将无法使用；在使用它之前，它必须遍历整个无限列表。所以，如果你做这样的事情，在你可以恢复状态相关的计算之前，你必须 put一个新鲜的状态。]

关于haskell - 为什么简单地使用 State monad 会导致堆栈溢出？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7998458/

25

4

0

文章推荐： arrays - 如何在 R 中制作对角矩阵数组？

文章推荐： reactjs - 如何使用 jest 测试 redux-saga 所有效果

文章推荐： reactjs - React Linting，缺少 "react"的文件扩展名(导入/扩展)

文章推荐： r - R在y轴上更改缩放格式

haskell - Haskell 和类 Haskell 语言之间的类型声明语法差异
在 Haskell 中，类型声明使用双冒号，即 (::)，如 not::Bool -> Bool。但是在许多语法与 Haskell 类似的语言中，例如榆树、 Agda 、他们使用单个冒号(:)来声明
haskell - 在模板 haskell 中运行模板 haskell
insertST :: StateDecoder -> SomeState -> Update SomeState SomeThing insertST stDecoder st = ... Stat
haskell - 在 Haskell ("second order Haskell"中生成 Haskell 类型的工具？
如果这个问题有点含糊，请提前道歉。这是一些周末白日梦的结果。借助 Haskell 出色的类型系统，将数学(尤其是代数)结构表达为类型类是非常令人愉快的。我的意思是，看看 numeric-prelud
haskell - 如何仅使用 Haskell 无休止地运行 Haskell 程序？
我有需要每 5 分钟执行一次的小程序。目前，我有执行该任务的 shell 脚本，但我想通过 CLI 中的键为用户提供无需其他脚本即可运行它的能力。实现这一目标的最佳方法是什么？最佳答案我想你会
haskell - 需要以真实世界 Haskell 风格解决哪些 Haskell 主题？
RWH 面世已经有一段时间了(将近 3 年)。在在线跟踪这本书的渐进式写作之后，我渴望获得我的副本(我认为这是写书的最佳方式之一。)在所有相当学术性的论文中，作为一个 haskell 学生，读起来多么
haskell - 用 Haskell 编写 Haskell 解释器
一个经典的编程练习是用 Lisp/Scheme 编写一个 Lisp/Scheme 解释器。可以利用完整语言的力量来为该语言的子集生成解释器。 Haskell 有类似的练习吗？我想使用 Haskell
haskell - Haskell 中的仿函数定义及其在 Learn You a Haskell 中的解释令人困惑
以下摘自' Learn You a Haskell ' 表示 f 在函数中用作“值的类型”。这是什么意思？即“值的类型”是什么意思？ Int 是“值的类型”，对吗？但是 Maybe 不是“值的类型”
haskell - haskell 中有包含字符串和列表的类型吗？
现在我正在尝试创建一个基本函数，用于删除句子中的所有空格或逗号。 stringToIntList :: [Char] -> [Char] stringToIntList inpt = [ a | a
haskell - 案例中的模式匹配，Haskell
我是 Haskell 的新手，对模式匹配有疑问。这是代码的高度简化版本: data Value = MyBool Bool | MyInt Integer codeDuplicate1 :: Valu
haskell - Haskell 中的这个仿函数是什么意思？
如何解释这个表达式？ :t (+) (+3) (*100) 自和具有相同的优先级并且是左结合的。我认为这与 ((+) (+3)) (*100) 相同.但是，我不知道它的作用。在 Learn
haskell - Haskell 如何计算表达式
这怎么行 > (* 30) 4 120 但这不是 > * 30 40 error: parse error on input ‘*’ 最佳答案 (* 30) 是一个 section，它仍然将 * 视为
haskell - 删除满足谓词的第一个元素(Haskell)
我想创建一个函数，删除满足第二个参数中给定谓词的第一个元素。像这样: removeFirst "abab" ( 'b') = "abab" removeFirst [1,2,3,4] even =
haskell - Haskell 中的内存
Context : def fib(n): if n aand returns a memoized version of the same function. The trick is t
haskell - 惰性评估和严格评估 Haskell
我明白惰性求值是什么，它是如何工作的以及它有什么优势，但是你能解释一下 Haskell 中什么是严格求值吗？我似乎找不到太多关于它的信息，因为惰性评估是最著名的。他们各自的优势是什么。什么时候真正使
haskell - Haskell 中的反向函数行为
digits :: Int -> [Int] digits n = reverse (x) where x | n digits 1234 = [3,1,2,4]
haskell - Haskell 是否支持类型类的匿名实例？
我在 F# 中有以下代码(来自一本书) open System.Collections.Generic type Table = abstract Item : 'T -> 'U with ge
haskell - 使用需要多个输入的过滤器 - Haskell
我对 Haskell 比较陌生，过去几周一直在尝试学习它，但一直停留在过滤器和谓词上，我希望能得到帮助以帮助理解。我遇到了一个问题，我有一个元组列表。每个元组包含一个 (songName, song
haskell - 或采用两个值参数 haskell
我是 haskell 的初学者，我试图为埃拉托色尼筛法定义一个简单的函数，但它说错误: • Couldn't match expected type ‘Bool -> Bool’
haskell - Haskell 中的读取函数
我是 Haskell 语言的新手，我在使用 read 函数时遇到了一些问题。准确地说，我的理解是: read "8.2" + 3.8 应该返回 12.0，因为我们希望返回与第二个成员相同的类型。我真正
haskell - Haskell 声明中的感叹号是什么意思？
当我尝试使用真实项目来驱动它来学习 Haskell 时，我遇到了以下定义。我不明白每个参数前面的感叹号是什么意思，我的书上好像也没有提到。 data MidiMessage = MidiMessage

首页

博学

6Ren·AI

商城

haskell - 为什么简单地使用 State monad 会导致堆栈溢出？