a -> a 和a有 加性 属性(property)。所以我们可以看成union作为 (+) 的一个版本 比如说,我们有 [a] ,并希望执行并行-6ren">
gpt4 book ai didi

haskell - Haskell中的并行 "Folding"

转载 作者:行者123 更新时间:2023-12-04 03:15:52 24 4
gpt4 key购买 nike

我有一个类型如下的函数:

union :: a -> a -> a

a加性 属性(property)。所以我们可以看成 union作为 (+) 的一个版本

比如说,我们有 [a] ,并希望执行并行 "folding" ,对于非平行折叠,我们只能做:
foldl1' union [a]

但是如何并行执行呢?
我可以在 Num 上演示问题值和 (+)功能。

例如,我们有一个列表 [1,2,3,4,5,6](+)并行我们应该拆分
[1,2,3] (+) [4,5,6]
[1,2] (+) [3] (+) [4,5] (+) [6]
([1] (+) [2]) (+) ([3] (+) [4]) (+) ([5] (+) [6])

然后每个 (+)我们要并行执行的操作,并结合起来回答
[3] (+) [7] (+) [11] = 21

请注意,我们拆分列表或以任何顺序执行操作,因为 a可加性。

有没有办法使用任何标准库来做到这一点?

最佳答案

你需要概括你的union任何关联二元运算符 ⊕ 使得 (a ⊕ b) ⊕ c == a ⊕ (b ⊕ c)。如果同时你甚至有一个相对于⊕中性的单位元素,你就有一个幺半群。

关联性的重要方面是您可以任意组合列表中的连续元素 block ,并以任意顺序 ⊕ 它们,因为 a ⊕ (b ⊕ (c ⊕ d)) == (a ⊕ b) ⊕ (c ⊕ d ) - 每个括号可以并行计算;那么您需要“减少”所有括号的“总和”,并且您已经对 map-reduce 进行了排序。

为了使这种并行化有意义,您需要分 block 操作比 ⊕ 更快 - 否则,顺序执行 ⊕ 比分 block 更好。一种这样的情况是当你有一个随机访问“列表”——比如一个数组。 Data.Array.Repa具有大量并行折叠功能。

如果您正在考虑练习自己实现一个,您需要选择一个好的复杂函数⊕,这样好处就会显现出来。

例如:

import Control.Parallel
import Data.List

pfold :: (Num a, Enum a) => (a -> a -> a) -> [a] -> a
pfold _ [x] = x
pfold mappend xs = (ys `par` zs) `pseq` (ys `mappend` zs) where
len = length xs
(ys', zs') = splitAt (len `div` 2) xs
ys = pfold mappend ys'
zs = pfold mappend zs'

main = print $ pfold (+) [ foldl' (*) 1 [1..x] | x <- [1..5000] ]
-- need a more complicated computation than (+) of numbers
-- so we produce a list of products of many numbers

这里我特意使用了关联操作,叫做 mappend仅在局部,以表明它可以适用于比幺半群更弱的概念——只有关联性对并行性很重要;因为并行性只对非空列表有意义,所以不需要 mempty .
ghc -O2 -threaded a.hs
a +RTS -N1 -s

总运行时间为 8.78 秒,而
a +RTS -N2 -s

在我的双核笔记本电脑上提供 5.89 秒的总运行时间。显然,在这台机器上尝试超过 -N2 是没有意义的。

关于haskell - Haskell中的并行 "Folding",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/19117922/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com