- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这实际上是this的后续问题问题。我设法让分析工作正常进行,问题似乎确实是懒惰的评估。
我使用的数据结构是Map Int (Map Int Text)
,其中Text
来自Data.Text 。问题是,构建这个 map 的函数会产生一个巨大的重击。处理大约 3 MB 的输入文本时,程序需要超过 250 MB 的内存。
现在讨论这个问题的真正目的:
要获取此数据结构中的字符数,请使用以下函数:
type TextResource = M.Map Int (M.Map Int T.Text)
totalSize :: TextResouce -> Int
totalSize = M.fold ((+) . (M.fold ((+). T.length) 0)) 0
不漂亮,但它完成了工作。我在创建 TextResource 后立即在主函数中使用此函数。有趣的是,当我使用 RTS 选项 -hr
或 -hc
分析程序时,一段时间后内存使用量下降到 70 或 50 MB,这那就完全没问题了。
不幸的是,这仅在使用分析选项和 totalSize
函数时才有效 - 如果没有它们,它会回到 250 MB。
我上传了程序(< 70行)以及测试文件和cabal文件,以便您可以自己尝试一下:Link
test.xml是生成的XML文件,应将其放入可执行文件目录中。要构建,cabal configure --enable-executable-profiling
和之后的 cabal build
应该足够了(如果您安装了所需库的分析版本)。
使用+RTS -hc
运行程序一次和不使用+RTS -hc
运行程序一次时,您可以看到变化。
如果有人可以运行该程序,我会非常高兴,因为我真的被困在这里了。我已经尝试在几个地方放入deepseq,但没有任何效果(嗯,除了使用分析选项之外)。
编辑:
Profiling does show, however, that only ~20MB of the heap is used, so as in my comment, I blame GHC for not freeing as much of the GC nursery memory as you seem to want.
谢谢,这为我指明了正确的方向。事实证明,您可以告诉 GHC 执行垃圾收集 ( performGC ),在对 map 进行深度搜索后,效果非常好。尽管我猜想不推荐使用performGC,但它似乎是适合这里工作的工具。
编辑2:这就是我更改 main 函数的方式(+ deepseqing buildTextFile 的返回):
main = do tf <- buildTextFile "test.xml"
performGC
putStrLn . show . text 1 1000 $ tf
getLine
putStrLn . show . text 100 1000 $ tf
return ()
最佳答案
The problem is, that the function which builds this map creates a huge thunk.
没有。基于堆分析,我不认为空间使用是重击。另外,我用严格的 HashMap 替换了 Data.Map,并强制映射(以避免创建大的重击)具有相同的结果。
when I profile the program by using the RTS option -hr or -hc the memory usage goes down to 70 or 50 MB after a while
我无法重现这个。使用 -hr
、-hy
或 -hc
进程会保留 140MB 堆。然而,分析确实表明只使用了大约 20MB 的堆,因此正如我在评论中所说,我责怪 GHC 没有释放您想要的那么多 GC 苗圃内存。
对于计算过程中的高内存使用,上面的-hy
配置文件显示大部分内存是由于String
类型和HaXML库Posn
类型。我将重申我的建议,即寻找一个基于 ByteString
或 Text
的 XML 库,该库更注重资源(xml-enumerator?)。
关于haskell - 内存分析会改变内存使用情况(变得更好),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6878334/
在 Haskell 中,类型声明使用双冒号,即 (::),如 not::Bool -> Bool。 但是在许多语法与 Haskell 类似的语言中,例如榆树、 Agda 、他们使用单个冒号(:)来声明
insertST :: StateDecoder -> SomeState -> Update SomeState SomeThing insertST stDecoder st = ... Stat
如果这个问题有点含糊,请提前道歉。这是一些周末白日梦的结果。 借助 Haskell 出色的类型系统,将数学(尤其是代数)结构表达为类型类是非常令人愉快的。我的意思是,看看 numeric-prelud
我有需要每 5 分钟执行一次的小程序。 目前,我有执行该任务的 shell 脚本,但我想通过 CLI 中的键为用户提供无需其他脚本即可运行它的能力。 实现这一目标的最佳方法是什么? 最佳答案 我想你会
RWH 面世已经有一段时间了(将近 3 年)。在在线跟踪这本书的渐进式写作之后,我渴望获得我的副本(我认为这是写书的最佳方式之一。)在所有相当学术性的论文中,作为一个 haskell 学生,读起来多么
一个经典的编程练习是用 Lisp/Scheme 编写一个 Lisp/Scheme 解释器。可以利用完整语言的力量来为该语言的子集生成解释器。 Haskell 有类似的练习吗?我想使用 Haskell
以下摘自' Learn You a Haskell ' 表示 f 在函数中用作“值的类型”。 这是什么意思?即“值的类型”是什么意思? Int 是“值的类型”,对吗?但是 Maybe 不是“值的类型”
现在我正在尝试创建一个基本函数,用于删除句子中的所有空格或逗号。 stringToIntList :: [Char] -> [Char] stringToIntList inpt = [ a | a
我是 Haskell 的新手,对模式匹配有疑问。这是代码的高度简化版本: data Value = MyBool Bool | MyInt Integer codeDuplicate1 :: Valu
如何解释这个表达式? :t (+) (+3) (*100) 自 和 具有相同的优先级并且是左结合的。我认为这与 ((+) (+3)) (*100) 相同.但是,我不知道它的作用。在 Learn
这怎么行 > (* 30) 4 120 但这不是 > * 30 40 error: parse error on input ‘*’ 最佳答案 (* 30) 是一个 section,它仍然将 * 视为
我想创建一个函数,删除满足第二个参数中给定谓词的第一个元素。像这样: removeFirst "abab" ( 'b') = "abab" removeFirst [1,2,3,4] even =
Context : def fib(n): if n aand returns a memoized version of the same function. The trick is t
我明白惰性求值是什么,它是如何工作的以及它有什么优势,但是你能解释一下 Haskell 中什么是严格求值吗?我似乎找不到太多关于它的信息,因为惰性评估是最著名的。 他们各自的优势是什么。什么时候真正使
digits :: Int -> [Int] digits n = reverse (x) where x | n digits 1234 = [3,1,2,4]
我在 F# 中有以下代码(来自一本书) open System.Collections.Generic type Table = abstract Item : 'T -> 'U with ge
我对 Haskell 比较陌生,过去几周一直在尝试学习它,但一直停留在过滤器和谓词上,我希望能得到帮助以帮助理解。 我遇到了一个问题,我有一个元组列表。每个元组包含一个 (songName, song
我是 haskell 的初学者,我试图为埃拉托色尼筛法定义一个简单的函数,但它说错误: • Couldn't match expected type ‘Bool -> Bool’
我是 Haskell 语言的新手,我在使用 read 函数时遇到了一些问题。准确地说,我的理解是: read "8.2" + 3.8 应该返回 12.0,因为我们希望返回与第二个成员相同的类型。我真正
当我尝试使用真实项目来驱动它来学习 Haskell 时,我遇到了以下定义。我不明白每个参数前面的感叹号是什么意思,我的书上好像也没有提到。 data MidiMessage = MidiMessage
我是一名优秀的程序员,十分优秀!