performance - 如何在 Haskell 中获得 5GB 堆的控制权？-6ren

performance - 如何在 Haskell 中获得 5GB 堆的控制权？

转载作者：行者123 更新时间：2023-12-03 06:11:18

25

4

目前，我正在尝试使用 Snap 编写的一个小型 Haskell Web 服务器，该服务器加载并向客户端提供大量数据。我很难控制服务器进程。该进程有时会在数秒到数分钟内使用大量 CPU，并且对客户端请求无响应。有时，内存使用量会在几秒钟内激增(有时会下降)数百兆字节。

希望有人对长时间运行的使用大量内存的 Haskell 进程有更多的经验，并且可以给我一些指导，使事情更加稳定。我已经调试这个东西好几天了，我开始有点绝望了。

我的设置的一些概述:

在服务器启动时，我将大约 5 GB 的数据读取到内存中的一个大(嵌套)Data.Map 类似结构中。嵌套映射是值严格的，映射内的所有值都是数据类型，其所有字段也都是严格的。我花了很多时间来确保不留下任何未评估的重击。导入(取决于我的系统负载)大约需要 5-30 分钟。奇怪的是，连续运行的波动比我预期的要大得多，但这是一个不同的问题。
大数据结构位于“TVar”内，该“TVar”由 Snap 服务器生成的所有客户端线程共享。客户端可以使用小型查询语言请求数据的任意部分。数据请求量通常很小(最多300kb左右)并且只涉及数据结构的一小部分。所有只读请求均使用“readTVarIO”完成，因此不需要任何 STM 事务。
服务器使用以下标志启动:+RTS -N -I0 -qg -qb。这将以多线程模式启动服务器，禁用空闲时间和并行 GC。这似乎大大加快了进程。

服务器基本上运行没有任何问题。然而，客户端请求时不时会超时，CPU 峰值达到 100%(甚至超过 100%)，并持续很长一段时间。同时服务器不再响应请求。

我认为可能导致 CPU 使用率的原因如下:

该请求需要花费大量时间，因为有大量工作要做。这有点不太可能，因为有时会发生这种情况，这些请求在之前的运行中被证明非常快(我的意思是 20-80 毫秒左右)。
在处理数据并将其发送到客户端之前，仍然需要计算一些未评估的 thunk。这也不太可能，原因与上一点相同。
垃圾收集不知何故启动并开始扫描我的整个 5GB 堆。我可以想象这会占用很多时间。

问题是我不知道如何弄清楚到底发生了什么以及该怎么办。因为导入过程需要很长时间，所以分析结果没有向我显示任何有用的东西。似乎无法从代码内有条件地打开和关闭探查器。

我个人怀疑GC是这里的问题。我正在使用 GHC7，它似乎有很多选项可以调整 GC 的工作方式。

当使用数据通常非常稳定的大型堆时，您建议采用什么 GC 设置？

最佳答案

大量内存使用和偶尔的 CPU 峰值几乎肯定是 GC 启动的原因。您可以使用 -B 等 RTS 选项来查看情况是否确实如此，这会导致 GHC 在出现问题时发出蜂鸣声主要集合，-t 会告诉您事后统计信息(特别是查看 GC 时间是否真的很长)或 -Dg，它打开调试信息用于 GC 调用(尽管您需要使用 -debug 进行编译)。

您可以采取多种措施来缓解此问题:

在最初导入数据时，GHC 浪费了大量时间来增加堆。您可以通过指定一个大的 -H 来告诉它立即获取您需要的所有内存。
具有稳定数据的大堆将被提升到老一代。如果使用 -G 增加代数，则可能能够将稳定的数据置于最古老、很少进行 GC 的代中，而您拥有更传统的年轻堆和老堆上面。
根据应用程序其余部分的内存使用情况，您可以使用 -F 来调整 GHC 在再次收集老一代之前允许其增长的量。您可以调整此参数来收集这些非垃圾。
如果没有写入，并且您有一个定义良好的接口(interface)，则可能值得让该内存不由 GHC 管理(使用 C FFI)，这样就不会有 super GC 的机会曾经。

这些都是猜测，因此请使用您的特定应用程序进行测试。

关于performance - 如何在 Haskell 中获得 5GB 堆的控制权？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6623391/

25

4

0

文章推荐： tfs - NuGet 和 TFS 最佳实践

文章推荐： intellij-idea - 有没有办法在 JetBrains IDE 之间同步设置？

haskell - Haskell 和类 Haskell 语言之间的类型声明语法差异
在 Haskell 中，类型声明使用双冒号，即 (::)，如 not::Bool -> Bool。但是在许多语法与 Haskell 类似的语言中，例如榆树、 Agda 、他们使用单个冒号(:)来声明
haskell - 在模板 haskell 中运行模板 haskell
insertST :: StateDecoder -> SomeState -> Update SomeState SomeThing insertST stDecoder st = ... Stat
haskell - 在 Haskell ("second order Haskell"中生成 Haskell 类型的工具？
如果这个问题有点含糊，请提前道歉。这是一些周末白日梦的结果。借助 Haskell 出色的类型系统，将数学(尤其是代数)结构表达为类型类是非常令人愉快的。我的意思是，看看 numeric-prelud
haskell - 如何仅使用 Haskell 无休止地运行 Haskell 程序？
我有需要每 5 分钟执行一次的小程序。目前，我有执行该任务的 shell 脚本，但我想通过 CLI 中的键为用户提供无需其他脚本即可运行它的能力。实现这一目标的最佳方法是什么？最佳答案我想你会
haskell - 需要以真实世界 Haskell 风格解决哪些 Haskell 主题？
RWH 面世已经有一段时间了(将近 3 年)。在在线跟踪这本书的渐进式写作之后，我渴望获得我的副本(我认为这是写书的最佳方式之一。)在所有相当学术性的论文中，作为一个 haskell 学生，读起来多么
haskell - 用 Haskell 编写 Haskell 解释器
一个经典的编程练习是用 Lisp/Scheme 编写一个 Lisp/Scheme 解释器。可以利用完整语言的力量来为该语言的子集生成解释器。 Haskell 有类似的练习吗？我想使用 Haskell
haskell - Haskell 中的仿函数定义及其在 Learn You a Haskell 中的解释令人困惑
以下摘自' Learn You a Haskell ' 表示 f 在函数中用作“值的类型”。这是什么意思？即“值的类型”是什么意思？ Int 是“值的类型”，对吗？但是 Maybe 不是“值的类型”
haskell - haskell 中有包含字符串和列表的类型吗？
现在我正在尝试创建一个基本函数，用于删除句子中的所有空格或逗号。 stringToIntList :: [Char] -> [Char] stringToIntList inpt = [ a | a
haskell - 案例中的模式匹配，Haskell
我是 Haskell 的新手，对模式匹配有疑问。这是代码的高度简化版本: data Value = MyBool Bool | MyInt Integer codeDuplicate1 :: Valu
haskell - Haskell 中的这个仿函数是什么意思？
如何解释这个表达式？ :t (+) (+3) (*100) 自和具有相同的优先级并且是左结合的。我认为这与 ((+) (+3)) (*100) 相同.但是，我不知道它的作用。在 Learn
haskell - Haskell 如何计算表达式
这怎么行 > (* 30) 4 120 但这不是 > * 30 40 error: parse error on input ‘*’ 最佳答案 (* 30) 是一个 section，它仍然将 * 视为
haskell - 删除满足谓词的第一个元素(Haskell)
我想创建一个函数，删除满足第二个参数中给定谓词的第一个元素。像这样: removeFirst "abab" ( 'b') = "abab" removeFirst [1,2,3,4] even =
haskell - Haskell 中的内存
Context : def fib(n): if n aand returns a memoized version of the same function. The trick is t
haskell - 惰性评估和严格评估 Haskell
我明白惰性求值是什么，它是如何工作的以及它有什么优势，但是你能解释一下 Haskell 中什么是严格求值吗？我似乎找不到太多关于它的信息，因为惰性评估是最著名的。他们各自的优势是什么。什么时候真正使
haskell - Haskell 中的反向函数行为
digits :: Int -> [Int] digits n = reverse (x) where x | n digits 1234 = [3,1,2,4]
haskell - Haskell 是否支持类型类的匿名实例？
我在 F# 中有以下代码(来自一本书) open System.Collections.Generic type Table = abstract Item : 'T -> 'U with ge
haskell - 使用需要多个输入的过滤器 - Haskell
我对 Haskell 比较陌生，过去几周一直在尝试学习它，但一直停留在过滤器和谓词上，我希望能得到帮助以帮助理解。我遇到了一个问题，我有一个元组列表。每个元组包含一个 (songName, song
haskell - 或采用两个值参数 haskell
我是 haskell 的初学者，我试图为埃拉托色尼筛法定义一个简单的函数，但它说错误: • Couldn't match expected type ‘Bool -> Bool’
haskell - Haskell 中的读取函数
我是 Haskell 语言的新手，我在使用 read 函数时遇到了一些问题。准确地说，我的理解是: read "8.2" + 3.8 应该返回 12.0，因为我们希望返回与第二个成员相同的类型。我真正
haskell - Haskell 声明中的感叹号是什么意思？
当我尝试使用真实项目来驱动它来学习 Haskell 时，我遇到了以下定义。我不明白每个参数前面的感叹号是什么意思，我的书上好像也没有提到。 data MidiMessage = MidiMessage

首页

博学

6Ren·AI

商城

performance - 如何在 Haskell 中获得 5GB 堆的控制权？