optimization - 为什么 `logBase 10 x` 比 `log x/log 10` 慢，即使是专门的？-6ren

optimization - 为什么 `logBase 10 x` 比 `log x/log 10` 慢，即使是专门的？

转载作者：行者123 更新时间：2023-12-03 13:59:30

solrize在#haskell 中询问了有关此代码的一个版本的问题，我尝试了其他一些案例，想知道发生了什么。在我的机器上，“快速”代码大约需要 1 秒，“慢”代码需要大约 1.3-1.5 秒(所有内容都使用 ghc -O2 编译)。

import Data.List

log10 :: Double -> Double
--log10 x = log x / log 10 -- fast
--log10 = logBase 10 -- slow
--log10 = barLogBase 10 -- fast
--log10 = bazLogBase 10 -- fast
log10 = fooLogBase 10 -- see below

class Foo a where
    fooLogBase :: a -> a -> a

instance Foo Double where
    --fooLogBase x y = log y / log x -- slow
    fooLogBase x = let lx = log x in \y -> log y / lx -- fast


barLogBase :: Double -> Double -> Double
barLogBase x y = log y / log x

bazLogBase :: Double -> Double -> Double
bazLogBase x = let lx = log x in \y -> log y / lx


main :: IO ()
main = print . foldl' (+) 0 . map log10 $ [1..1e7]

我希望 GHC 能够转 logBase x y与 log y / log x 完全相同, 专业时。这里发生了什么，推荐使用 logBase 的方法是什么？ ?

最佳答案

和往常一样，看看核心。

快速(1.563 秒)-

-- note: top level constant, referred to by specialized fooLogBase

Main.main_lx :: GHC.Types.Double
Main.main_lx =
     case GHC.Prim.logDouble# 10.0 of { r ->
     GHC.Types.D# r
  }

Main.main7 :: GHC.Types.Double -> GHC.Types.Double
Main.main7 =
  \ (y :: GHC.Types.Double) ->
    case y of _ { GHC.Types.D# y# ->
    case GHC.Prim.logDouble# y# of { r0 ->
    case Main.main_lx of { GHC.Types.D# r ->
    case GHC.Prim./## r0 r of { r1 ->
    GHC.Types.D# r1
    }
    }
    }

慢(2.013 秒)

-- simpler, but recomputes log10 each time
Main.main7 =
  \ (y_ahD :: GHC.Types.Double) ->
    case y_ahD of _ { GHC.Types.D# x_aCD ->
    case GHC.Prim.logDouble# x_aCD of wild1_aCF { __DEFAULT ->
    case GHC.Prim.logDouble# 10.0 of wild2_XD9 { __DEFAULT ->
    case GHC.Prim./## wild1_aCF wild2_XD9 of wild3_aCz { __DEFAULT ->
    GHC.Types.D# wild3_aCz
    }
    }
    }
    }

在快速版本中，log10 计算一次并共享(静态参数仅应用一次)。在慢速版本中，它每次都会重新计算。

您可以按照以下推理生成更好的版本:

-- 1.30s
lx :: Double
lx = log 10

log10 :: Double -> Double
log10 y = log y / lx

main :: IO ()
main = print . foldl' (+) 0 . map log10 $ [1..1e7]

而且，使用数组融合，您可以消除组合风格的损失:

import qualified Data.Vector.Unboxed as V

lx :: Double
lx = log 10

log10 :: Double -> Double
log10 y = log y / lx

main :: IO ()
main = print . V.sum . V.map log10 $ V.enumFromN 1 (10^7)

成本降低 3 倍

$ time ./A
6.5657059080059275e7

real    0m0.672s
user    0m0.000s
sys     0m0.000s

这和手写一样好。与上面正确编写的版本相比，以下内容没有任何好处。

lx :: Double
lx = D# (GHC.Prim.logDouble# 10.0##)

log10 :: Double -> Double
log10 (D# y) = D# (case logDouble# y of r -> r /## d#)
    where
        D# d# = lx

main :: IO ()
main = print . V.sum . V.map log10 $ V.enumFromN 1 (10^7)

关于optimization - 为什么 `logBase 10 x` 比 `log x/log 10` 慢，即使是专门的？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11290929/

文章推荐： ios5 - 使用 UIStoryboards 时的最佳实践是什么？

文章推荐： pycharm - pycharm-我如何在整个项目中找到替换单词？

文章推荐： screen - LibGdx-屏幕之间的过渡

java - 判断一个数是否是4的幂，logNum % logBase == 0 vs (logNum/logBase) % 1 == 0
问题:检查一个数是否是 4 的幂。我在 Java 中的解决方案: public static boolean isPowerOfFour(int num) { return (Math.lo
Haskell:如何使用像 "logBase"这样的数学函数来处理无界整数？
我正在尝试生成斐波那契数列以与素数列表进行比较(例如)。两个列表都从第一个已知的 fibo/prime 数字开始，到第 10000 个结束。问题是:图形比较(图表)只有在某些函数(如“logBase
optimization - 为什么 `logBase 10 x` 比 `log x/log 10` 慢，即使是专门的？
solrize在#haskell 中询问了有关此代码的一个版本的问题，我尝试了其他一些案例，想知道发生了什么。在我的机器上，“快速”代码大约需要 1 秒，“慢”代码需要大约 1.3-1.5 秒(所有内

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

optimization - 为什么 `logBase 10 x` 比 `log x/log 10` 慢，即使是专门的？