parallel-processing - 为什么我们没有通过 PSeq 获得性能提升？

转载作者：行者123 更新时间：2023-12-02 08:08:15

24

4

问题

我们认为并行处理每个“尾排列”会减少该算法的实际运行时间。为什么不呢？我们如何配置 PSeq 来缩短运行时间？

let rec permute (xs:'t list) = 
    if xs.Length = 1 then [xs]
    else ([], permute xs.Tail)
        // Why do we not get a performance 
        // improvement when we use PSeq here
        // relative to using Seq?
        ||> PSeq.fold (fun acc ps -> 
            (insertAtEach xs.Head ps)@acc)

permute ["A";"B";"C"] |> ignore

我们认为排列工作将按如下方式拆分，并且算法的 insertAtEach 阶段将并行工作。

                        [C]

             [BC]                [CB]

[ABC] [BCA] [BCA]                [ACB] [CAB] [CBA]

            CPU01                CPU02

即使我们使用大型初始列表(如 permute [0..9])，它实际上在并行时也更慢。我们还没有弄清楚 withDegreeOfParallelism 和相关的 PSeq 选项是否有帮助。

一边

这是其余的代码 list :

let put a q xs =
    ([], xs)
        ||> Seq.fold (fun acc x ->
            if x = q then a::x::acc
            else x::acc)
        |> List.rev

// Insert x at each possible location in xs
let insertAtEach a xs =
    ([a::xs], xs)
        ||> Seq.fold (fun acc x ->
            (put a x xs)::acc)

最佳答案

PSeq.fold 并不像您想象的那样。 PSeq.fold 实际上根本不是并行的。它是连续的。

您不能只是在算法中间的某个地方抛出“并行”一词并希望获得最好的结果。这不是并行化的工作方式。您必须真正了解正在发生的事情、并行发生的事情、顺序发生的事情、原则上可以并行化的事情以及不能并行化的事情。

以fold 为例:它将提供的折叠函数应用到序列的每个元素和上一次调用的结果。由于每个下一个调用在执行之前都必须有上一个调用的结果，很明显 fold 根本不能并行执行。必须是顺序的。事实上，如果您查看其 source code，这就是 PSeq.fold 实际执行的操作。 .因此，每次转换为 ParallelSequence 都会产生一些开销，但没有任何收获。

现在，如果您仔细查看您的算法，您可以梳理出可并行化的部分。你的算法做什么:

递归计算尾部的排列。
对于这些排列中的每一个，通过在每个索引处插入头部来展开它。
连接第 2 步的所有结果。

当你这样说时，很容易看出第 2 步实际上并不依赖于任何东西，只依赖于它本身。每个尾部排列都与所有其他排列完全分开处理。

当然，仅查看您的源代码并不能证明这一点，因为您已将步骤 2 和 3 合并到一个表达式 (insertAtEach xs.Head ps)@acc 中，但它是使用以下一般身份很容易梳理:

xs |> fold (fun a x -> g a (f x))
    ===
xs |> map f |> fold (fun a x -> g a x)

也就是说，在 fold 期间，不是将函数 f 应用于每个元素 x，而是可以“提前”将它应用于每个元素"使用 map。

将这个想法应用到你的算法中，你会得到:

let rec permute (xs:'t list) = 
    if xs.Length = 1 then [xs]
    else permute xs.Tail 
         |> Seq.map (insertAtEach xs.Head)
         |> Seq.fold (fun acc ps -> ps@acc) []

现在很容易看出 Seq.map 步骤是可并行化的步骤:map 独立于其他元素将函数应用于每个元素，因此原则上可以并行工作。只需将 Seq 替换为 PSeq 即可获得并行版本:

let rec permute (xs:'t list) = 
    if xs.Length = 1 then [xs]
    else permute xs.Tail 
         |> PSeq.map (insertAtEach xs.Head)
         |> PSeq.fold (fun acc ps -> ps@acc) []

PSeq 是否确实并行执行 map 是另一回事，但这应该很容易根据经验进行验证。

事实上，在我的机器上，对于 7 到 10 个元素的列表(11 个元素的列表导致 OOM)，并行版本始终优于顺序版本。

附言请记住，在测量时间时，您需要首先强制生成序列(例如，通过将其转换为列表或采用 Seq.last)。否则，您要衡量的只是并行化开销成本。

附言here's a gist with my benchmark code .

关于parallel-processing - 为什么我们没有通过 PSeq 获得性能提升？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49523954/

24

4

0

文章推荐： vb.net - VB 不考虑 "and ” 1” 之间的区别

文章推荐： cmake - 获取由 add_subdirectory 添加的 CMake 项目版本

F# PSeq.iter 似乎没有使用所有内核
我一直在用 F# 做一些计算密集型的工作。类似 Array.Parallel.map 的函数使用 .Net Task Parallel Library 以指数方式加快了我的代码速度，而且工作量非常小。
haskell - 关于 Haskell 中的 'pseq'
考虑以下两个陈述: (a `par` b) `pseq` (a + b) 和 a `par` (b `pseq` (a + b)) 有人可以解释他们的行为有何不同吗？对于第一个，如果主线程完成了计算
parallel-processing - 为什么我们没有通过 PSeq 获得性能提升？
问题我们认为并行处理每个“尾排列”会减少该算法的实际运行时间。为什么不呢？我们如何配置 PSeq 来缩短运行时间？ let rec permute (xs:'t list) = if xs.
f# - 为什么带有计算表达式的 PSeq.map 似乎挂起？
我正在使用 FSharp.Collections.ParallelSeq 编写一个爬虫和一个retry computation 。我想并行地从多个页面检索 HTML，并且希望在请求失败时重试请求。例
haskell - 会使用 seq 代替 pseq 吗？
如果 pseq 确保计算顺序，而 seq 不能，那么为什么 seq 存在？是否有任何时候应该使用 seq 而不是 pseq？最佳答案它在文档页面上说， [pseq] restricts the t
f# - PSeq 是在 F# 3.0 中使用的正确方法吗？
我使用 F# powerpack 有一段时间了，它有很棒的 PSeq 模块，而且工作得非常好。但是它闻起来不太对劲，因为这是对 F# 库的扩展，而不是标准库。在 F# 中是否有更“正确”的方式来执行
haskell - 始终保证`seq`的评估顺序(此外还有`pseq`的奇怪行为)
seq函数的文档中指出: 关于评估顺序的注意事项:表达式seq a b不保证a在b之前会被评估。 seq给出的唯一保证是a和b都将在seq返回值之前进行评估。特别是，这意味着b可以在a之前进行评估。如
f# - 如何在 F# 3.0 中使用 pseq？
在 F# 3.0 中使用 PSeq 的最佳方式是什么？ F# 3.0 没有 powerpack，我也没有找到 PSeq 包含在 3.0 中的证据。最佳答案最简单的解决方案是复制 PSeq.fs文件
F# Func 类型推断 Seq 和 PSeq ToDictionary 的区别
给定一个简单的元组序列，以及一个使用 F# PowerPack 的 PSeq 的并行序列: let a = Seq.singleton (1,"a") --> val a: seq let b =
haskell - 为什么我们在 Haskell 中需要 'seq' 或 'pseq' 和 'par'？
我试图理解为什么我们需要标准示例代码的所有部分: a `par` b `pseq` a+b 为什么以下内容还不够？ a `par` b `par` a+b 上面的表达式似乎非常具有描述性:尝试同时评估
haskell - 为什么并发 Haskell 是非确定性的，而并行 Haskell 原语(par 和 pseq)是确定性的？
不太理解 Haskell 中并发和并行上下文中的决定论。一些例子会有所帮助。谢谢最佳答案处理纯值时，求值顺序并不重要。这本质上就是并行性的作用:并行评估纯值。与纯值相反，顺序通常对于具有副作用的操

首页

博学

6Ren·AI

商城

parallel-processing - 为什么我们没有通过 PSeq 获得性能提升？

问题

一边