performance - Haskell:映射长度。组比显式递归慢得多吗？-6ren

performance - Haskell:映射长度。组比显式递归慢得多吗？

转载作者：行者123 更新时间：2023-12-04 13:24:11

26

4

考虑这个整数素数分解的简单算法 n : 让 d'是 n 的除数最后找到。最初，设置 d'=1 .找到最小的除数 d>d'的 n , 并找到最大值 e这样 de划分 n .追加de找到答案并在 n/de 上重复该过程.最后在n时停止变为 1。为简单起见，让我们忽略数学优化，例如停在 sqrt n。等

我用两种方式实现了它。第一个生成除法“尝试”列表，然后按除数对成功的进行分组。例如，对于 n=20 , 我们首先生成 [(2,20),(2,10),(2,5),(3,5),(4,5),(5,5),(5,1)] ，然后我们将其转换为所需的 [(2,2),(5,1)]使用 group和其他库函数。

第二个实现是一个显式递归，它跟踪指数 e一路上，追加de一次最大的答案 e到达，继续寻找“下一个”d , 等等。

问题 1:为什么第一个实现的运行速度比第二个慢，尽管存在以下问题:

两个实现都执行div ，算法的核心步骤，次数大致相同。
惰性求值(和融合？)的效果是，从一开始就不必具体化上面说明的长列表。正如您在下面的代码中看到的那样，divTrials n ，我正在谈论的列表，是由一系列高阶函数转换的。在那，我认为这部分 map (\xs-> (head xs,length xs)) ... group应该告诉编译器列表只是中间的:

{-# OPTIONS_GHC -O2 #-}
module GroupCheck where
import Data.List
import Data.Maybe

implement1 :: Integral t=> t -> [(t,Int)]                    -- IMPLEMENTATION 1
implement1  = map (\xs-> (head xs,length xs)).factorGroups where
  tryDiv (d,n)
    | n `mod` d == 0 = (d,n `div` d)
    | n == 1 = (1,1) -- hack
    | otherwise = (d+1,n)
  divTrials n = takeWhile (/=(1,1)) $ (2,n): map tryDiv (divTrials n)
  factorGroups = filter (not.null).map tail.group.map fst.divTrials

implement2 :: Show t => Integral t => t -> [(t,Int)]         -- IMPLEMENTATION 2
implement2 num = keep2 $ tail $ go (1,0,1,num) where
  range d n = [d+1..n]
  nextd d n = fromMaybe n $ find ((0==).(n`mod`)) (range d n)
  update (d,e,de,n)
    | n `mod` d == 0 = update (d,e+1,de*d,n`div`d)
    | otherwise      = (d,e,de,n)
  go (d,e,de,1) = [(d,e,de,1)]
  go (d,e,de,n) = (d,e,de,n) : go (update (nextd d n,0,1,n))
  keep2 = map (\(d,e,_,_)->(d,e))

main :: IO ()
main = do
  let n = 293872
  let ans1 = implement1 n 
  let ans2 = implement2 n
  print ans1
  print ans2

分析告诉我们 tryDiv和 divTrials一起吃掉整个执行时间的 >99%:

> stack ghc -- -main-is GroupCheck.main -prof -fprof-auto -rtsopts GroupCheck 
> ./GroupCheck +RTS -p >/dev/null && cat GroupCheck.prof


           GroupCheck +RTS -p -RTS

        total time  =       18.34 secs   (18338 ticks @ 1000 us, 1 processor)
        total alloc = 17,561,404,568 bytes  (excludes profiling overheads)

COST CENTRE          MODULE     SRC                          %time %alloc

implement1.divTrials GroupCheck GroupCheck.hs:12:3-69         52.6   69.2
implement1.tryDiv    GroupCheck GroupCheck.hs:(8,3)-(11,25)   47.2   30.8

问题 1.5:那么..这些函数有什么不好的地方？还有，

问题 2:在更一般的情况下，必须聚合来自非递减序列的相同元素的连续 block ，我们是否应该使用庞大的 implement2如果我们想要速度呢？ (同样，忽略特定领域的优化。)

还是我完全错过了一些明显的东西？谢谢!

最佳答案

为了建立基线，我在稍大的起始数字上运行了您的程序(这样 time 就不会打印出 0.00s)。我选择 n = 2938722345623 没有特别的原因。以下是开始调整之前的时间安排:

ans1: 和infinity没有区别(我写完了整个答案，还在跑，一共大概26分钟)
ans2:2.78s

首先要尝试调整这一行:

divTrials n = takeWhile (/=(1,1)) $ (2,n): map tryDiv (divTrials n)

这看起来是一个很自然的定义，但事实证明 GHC 从不内存函数调用。因此，如果您想创建一个根据自身递归定义的列表，则不得在递归中进行函数调用。方法如下:

divTrials n = xs where xs = takeWhile (/=(1,1)) $ (2,n): map tryDiv xs

仅此一项更改便可将时间缩短至 7.85 秒。仍然相差约 3 倍，但好得多。

不太明显的问题在于:

factorGroups = filter (not.null).map tail.group.map fst.divTrials

将 group 放得太早会破坏融合，导致中间列表实际上被具体化。这意味着分配和释放大量的 cons 单元和元组。这是一个具有相同精神的实现，但在 group 之前做了更多工作:

  tryDiv d n
    | n `mod` d == 0 = d : tryDiv d (n `div` d)
    | n == 1 = []
    | otherwise = tryDiv (d+1) n
  factorGroups = group . tryDiv 2

这样一来，我们就降到了 2.65 秒——比 ans2 稍微快一点，不过我只对每个测试进行了一次测试，所以很可能只是测量噪声。

关于performance - Haskell:映射长度。组比显式递归慢得多吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69658001/

26

4

0

文章推荐： c++ - 什么时候在 GCC 上的成员函数指针中使用增量？

文章推荐： javascript - jQuery Textillate 选项未创建预期结果

文章推荐： elasticsearch - 同一字段的 Elasticsearch 多个过滤器值

c++ - 映射/设置迭代器不是可取消引用的 C++ 映射
请看一下我的代码。 int main () { Program* allcommand = new Program; allcommand->addCommand("add", new
c++ - typedef 映射、for 循环调试断言、映射/设置不兼容
因此，当我遇到调试断言时，我正在编写代码。现在我很想知道为什么这段代码不起作用: for(Model::MeshMap::iterator it = obj1->GetMeshes().begin()
java - 组、收集器、映射(整数到字符串)、映射(映射到对象)
这是我上一个问题的延续 Group, Sum byType then get diff using Java streams . 按照建议，我应该作为单独的线程发布，而不是更新原始线程。因此，通过我
javascript - JQuery 映射 vs Javascript 映射 vs For 循环
我正在实现一些非常适合 map 的代码。但是，我要迭代的列表中有大量对象，所以我的问题是哪种方法是解决此问题的最佳方法: var stuff = $.map(listOfMyObjects, some
不同类成员函数指针的C++映射
我正在尝试创建一个包含不同类的成员函数指针的映射。成员函数都具有相同的签名。为了做到这一点，我所有的类都继承了一个 Object 类，它只有默认构造函数、虚拟析构函数和一个虚拟 ToString()
具有相同键类型和不同项目类型的c++映射
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: how do you make a heterogeneous boost::map? 有可能在 C++ 中
Mysql WHERE IN 映射
我有一个 Mysql 查询，请检查以下内容: SELECT `tbl_classSubjects`.`classID` , `tbl_classSubjects`.`sectionID` , `tbl
JNA直接与接口(interface)映射？
抱歉，这可能是一个基本问题。 JNA直接映射和接口(interface)映射有什么区别？我的解释是否正确: 直接映射 : 直接使用库对象(如 Java 中的静态 main) 接口(interface
以部分函数为值的 Scala 映射
在 Twitter's Scala school collections section ，它们显示了一个带有偏函数作为值的 Map: // timesTwo() was defined earlie
FFMPEG channel 映射
很难说出这里问的是什么。这个问题是模棱两可的、模糊的、不完整的、过于宽泛的或修辞的，无法以目前的形式得到合理的回答。如需帮助澄清这个问题以便重新打开它，visit the help center .
具有原始类型值类型的 Scala 映射
据我了解，从 scala stdlib 声明一个映射并没有将其专门用于原始类型。我要的不是付出装箱/拆箱的代价，而是同时拥有scala map 的接口(interface)。一个明显的选择是使用 tr
没有键路径的数组的 Restkit 映射
如何为这样的 JSON 响应创建对象映射，它只是一个整数数组: [ 565195, 565309, 565261, 565515, 565292, 565281, 566346, 5
NHibernate DTO 映射
是否可以为 DTO 对象创建映射然后查询它们而不是域？如果不解释为什么？如果我需要几个 dtos 怎么办？ DTos 是只读的 ID 由 NH 自动生成将来这些 dtos 将设置映射到链接的 d
包含混合类型值的 Scala 映射
我有一个返回的函数(常规代码) [words: "one two", row: 23, col: 45] 在 Scala 中，我将上面更改为 Scala Map，但随后我被迫将其声明为 Map[Str
python - 映射 - 特征重要性与标签分类
我有一组与 Vanilla 磅蛋糕烘焙相关的数据(200 行)，具有 27 个特征，如下所示。标签caketaste是衡量烤蛋糕的好坏程度，由 bad(0) 定义, neutral(1) , good
复杂连接的 Hibernate 映射
我有试图映射到新代码的遗留代码。 OLD_PERSON pid sid name age NEW_PERSON pid sid fid age RESOLVE_PERSON pid fid statu
带有鉴别器的 hibernate 映射
我有一个表，其中一个字段可以指向其他 3 个表之一中的外键，具体取决于鉴别器值是什么(Project、TimeKeep 或 CostCenter。通常这是用子类实现的，我想知道我有什么注意子类名称与
Haskell:映射 runST
我有一个类型 [ST s (Int, [Int])] 的绑定(bind)我正在尝试申请runST使用映射到每个元素，如下所示: name :: [ST s (Int, [Int])] --Of Cou
子类和连接子类的 NHibernate 映射
在我正在进行的项目中，我有以下实体:分析师、客户和承包商。每个都继承自基类 User。 public abstract class User { public virtual int Id
用户输入的 Vim 映射
我想知道是否可以在 Vim 中创建一个映射(对于普通模式)，允许用户在映射执行之前输入。我想为我最常用的 grep 命令创建一个快捷方式的映射。我希望命令允许输入我正在搜索的内容，然后在输入时执行。

首页

博学

6Ren·AI

商城

performance - Haskell:映射长度。组比显式递归慢得多吗？