gpt4 book ai didi

haskell - 防止 Criterion 基准测试中的计算缓存

转载 作者:行者123 更新时间:2023-12-02 20:26:12 24 4
gpt4 key购买 nike

以下代码(由 Reid Barton 在 Criterion causing memory consumption to explode, no CAFs in sight 处建议)有一个基准时间,与 num按比例缩放当使用 O0 优化编译时。然而,使用O3优化似乎会导致基准时间独立num。结果在核心的哪个位置被缓存,我该如何防止它被缓存?

代码是:

{-# OPTIONS_GHC -fno-cse #-}
{-# LANGUAGE BangPatterns #-}
module Main where
import Criterion.Main
import Data.List

num :: Int
num = 100000000

lst :: a -> [Int]
lst _ = [1,2..num]

myadd :: Int -> Int -> Int
myadd !x !y = let !result = x + y in
result

mysum = foldl' myadd 0

main :: IO ()
main = defaultMain [
bgroup "summation"
[bench "mysum" $ whnf (mysum . lst) ()]
]

核心是:

main7
main7 = unpackCString# "mysum"#

main8
main8 = unpackCString# "summation"#

Rec {
$wlgo
$wlgo =
\ ww_s6vW w_s6vT ->
case w_s6vT of _ {
[] -> ww_s6vW;
: x_a4dz xs_a4dA ->
case x_a4dz of _ { I# ipv_s4d4 ->
$wlgo (+# ww_s6vW ipv_s4d4) xs_a4dA
}
}
end Rec }

lst1
lst1 = efdtInt 1 2 100000000

lvl_r6yu
lvl_r6yu = case $wlgo 0 lst1 of ww_s6w5 { __DEFAULT -> I# ww_s6w5 }

Rec {
main_$s$wa
main_$s$wa =
\ sc_s6xB sc1_s6xC sc2_s6xD ->
case tagToEnum# (<=# sc1_s6xC 0) of _ {
False ->
case seq# lvl_r6yu sc2_s6xD of _ { (# ipv_a4BO, ipv1_a4BP #) ->
main_$s$wa sc_s6xB (-# sc1_s6xC 1) ipv_a4BO
};
True -> (# sc2_s6xD, () #)
}
end Rec }

main6
main6 =
\ w_s6w9 w1_s6wa ->
case w_s6w9 of _ { I64# ww1_s6wd ->
main_$s$wa () ww1_s6wd w1_s6wa
}

main5
main5 = Benchmark main7 (main6 `cast` ...)

main4
main4 = : main5 ([])

main3
main3 = BenchGroup main8 main4

main2
main2 = : main3 ([])

main1
main1 = \ eta_B1 -> defaultMain2 defaultConfig main2 eta_B1

main9
main9 = \ eta_B1 -> runMainIO1 (main1 `cast` ...) eta_B1

lst
lst = \ @ a_a40V _ -> lst1

main
main = main1 `cast` ...

myadd
myadd =
\ x_a3Io y_a3Ip ->
case x_a3Io of _ { I# ipv_s4d1 ->
case y_a3Ip of _ { I# ipv1_s4d4 -> I# (+# ipv_s4d1 ipv1_s4d4) }
}

mysum
mysum =
\ w_s6w2 ->
case $wlgo 0 w_s6w2 of ww_s6w5 { __DEFAULT -> I# ww_s6w5 }

num
num = I# 100000000

main
main = main9 `cast` ...

我标记的位置-ddump-simpl -fforce-recomp -O3 -dsuppress-all到调用的 ghc --make -no-link ... 命令的末尾由cabal 构建。我正在使用标准 1.1.0.0 和 GHC 版本 7.8.3。

最佳答案

结果缓存在您的 lvl_r6yu 中。可以看到lst1[0..num]提升到了顶层,从$wlgo 0 lst1可以看出求和的结果也被取出来了。

如果我们添加顶级定义 foo = mysum ,就更容易看到发生了什么。 lst,然后查看 foo 的核心。您可以看到 foo 是一个返回求和结果的常量函数。

如果我们添加 {-# OPTIONS -fno-full-laziness #-},则子表达式将不会被提升,因此基准测试将按预期工作。

通常,当使用 criterion 通过提供给 whnf 的参数来控制评估时,这是一个好主意。在我们的例子中:

bench "mysum" $ whnf (\size -> mysum [1..size]) num

无论优化还是提升,这都可以正常工作。

关于haskell - 防止 Criterion 基准测试中的计算缓存,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29340053/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com