haskell - 为什么仅对功能设计进行微小更改就会从根本上改变标准基准测试的结果？-6ren

haskell - 为什么仅对功能设计进行微小更改就会从根本上改变标准基准测试的结果？

转载作者：行者123 更新时间：2023-12-05 01:55:56

我有两个源文件，它们的功能大致相同。唯一的区别是，在第一种情况下，函数作为参数传递，而在第二种情况下，传递的是值。

第一种情况:

module Main where

import Data.Vector.Unboxed as UB
import qualified Data.Vector as V

import Criterion.Main

regularVectorGenerator :: (Int -> t) -> V.Vector t
regularVectorGenerator = V.generate 99999

unboxedVectorGenerator :: Unbox t => (Int -> t) -> UB.Vector t
unboxedVectorGenerator = UB.generate 99999

main :: IO ()
main = defaultMain
    [
        bench "boxed"   $ whnf regularVectorGenerator (+2137)
      , bench "unboxed" $ whnf unboxedVectorGenerator (+2137)
    ]

第二种情况:

module Main where

import Data.Vector.Unboxed as UB
import qualified Data.Vector as V

import Criterion.Main

regularVectorGenerator :: Int -> V.Vector Int
regularVectorGenerator = flip V.generate (+2137)

unboxedVectorGenerator :: Int -> UB.Vector Int
unboxedVectorGenerator = flip UB.generate (+2137)

main :: IO ()
main = defaultMain
    [
        bench "boxed"   $ whnf regularVectorGenerator 99999
      , bench "unboxed" $ whnf unboxedVectorGenerator 99999
    ]

我注意到，在基准测试向量大小时，如预期的那样，未装箱的向量总是更小，但两个向量的大小差异很大。这是

的输出

第一种情况:

 benchmarking boxed
 time                 7.626 ms   (7.515 ms .. 7.738 ms)
                     0.999 R²   (0.998 R² .. 0.999 R²)
 mean                 7.532 ms   (7.472 ms .. 7.583 ms)
 std dev              164.3 μs   (133.8 μs .. 201.3 μs)
 allocated:           1.000 R²   (1.000 R² .. 1.000 R²)
   iters              **1.680e7**    (1.680e7 .. 1.680e7)
   y                  2357.390   (1556.690 .. 3422.724)

 benchmarking unboxed
 time                 889.1 μs   (878.9 μs .. 901.8 μs)
                     0.998 R²   (0.995 R² .. 0.999 R²)
 mean                 868.6 μs   (858.6 μs .. 882.6 μs)
 std dev              39.05 μs   (28.30 μs .. 57.02 μs)
 allocated:           1.000 R²   (1.000 R² .. 1.000 R²)
   iters              **4000009.003** (4000003.843 .. 4000014.143)
   y                  2507.089   (2025.196 .. 3035.962)
 variance introduced by outliers: 36% (moderately inflated)

第二种情况:

 benchmarking boxed
 time                 1.366 ms   (1.357 ms .. 1.379 ms)
                     0.999 R²   (0.998 R² .. 1.000 R²)
 mean                 1.350 ms   (1.343 ms .. 1.361 ms)
 std dev              29.96 μs   (21.74 μs .. 43.56 μs)
 allocated:           1.000 R²   (1.000 R² .. 1.000 R²)
   iters              **2400818.350** (2400810.284 .. 2400826.685)
  y                  2423.216   (1910.901 .. 3008.024)
 variance introduced by outliers: 12% (moderately inflated)

 benchmarking unboxed
 time                 61.30 μs   (61.24 μs .. 61.37 μs)
                     1.000 R²   (1.000 R² .. 1.000 R²)
 mean                 61.29 μs   (61.25 μs .. 61.33 μs)
 std dev              122.1 ns   (91.64 ns .. 173.9 ns)
 allocated:           1.000 R²   (1.000 R² .. 1.000 R²)
   iters              **800040.029** (800039.745 .. 800040.354)
   y                  2553.830   (2264.684 .. 2865.637)

仅通过去参数化函数，向量的基准大小就减少了一个数量级。谁能解释一下为什么？

我用这些标志编译了两个例子:

-O2 -rtsopts

并推出

--regress allocated:iters +RTS -T

最佳答案

不同之处在于，如果生成函数在基准函数中已知，则生成器是内联的，并且所涉及的 Int-s 也被拆箱。如果生成函数是基准参数，则不能内联。

从基准测试的角度来看，第二个版本是正确的，因为在正常使用中我们希望内联生成函数。

关于haskell - 为什么仅对功能设计进行微小更改就会从根本上改变标准基准测试的结果？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/70017709/

文章推荐： flutter : Card with Gridview

文章推荐： python - 将 PyTorch 张量与 scikit-learn 结合使用

ios8 - NSUbiquitousKeyValueStore 不工作......根本
我遇到了一个似乎很独特的问题。我的 NSUbiquitousKeyValueStore 在模拟器中的启动之间根本不起作用。也就是说，我什至不是在谈论 iCloud 同步或类似的东西，我无法让它通过下面
Wix:PatchFamily 没有正确过滤转换(根本)
首先，我使用的是 WiX 版本 3.5.2519.0，但我也在最新的 3.6 版本上测试了它，结果相同。我很难确定 PatchFamily 究竟能过滤掉 torch 生成的差异的某些部分。按照手册中
javascript - Ember 嵌套路线和模型不渲染(根本)
我可以获取要呈现的“帮助主题”标题，但无法获取我定义的任何FIXTURES。 {{#each model}} 中的任何内容都不会渲染。这是我第一次使用 Ember，所以任何东西(字面意义上的任何东
ajax - 没有指定 dataType 的自定义 ajaxTransport 函数不会触发(根本!)
我一直在尝试设置custom ajaxTransports for jQuery在我们的产品的某些场景下缩短某些工作流程。然而，我在让这些传输受到尊重方面取得了零成功(而我有很多工作 custom a
lambda-calculus - 为什么 lambda 演算(根本)没有被大量使用？
为什么纯无类型 lambda 演算经常被描述为无法使用？有了合适的函数库，它会不会与任何其他函数式语言大致相同？最佳答案速度不是大问题。例如，您可以决定使用教堂数字但优化实现，以便像往常一样表示

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

haskell - 为什么仅对功能设计进行微小更改就会从根本上改变标准基准测试的结果？