- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们认为并行处理每个“尾排列”会减少该算法的实际运行时间。为什么不呢?我们如何配置 PSeq 来缩短运行时间?
let rec permute (xs:'t list) =
if xs.Length = 1 then [xs]
else ([], permute xs.Tail)
// Why do we not get a performance
// improvement when we use PSeq here
// relative to using Seq?
||> PSeq.fold (fun acc ps ->
(insertAtEach xs.Head ps)@acc)
permute ["A";"B";"C"] |> ignore
我们认为排列工作将按如下方式拆分,并且算法的 insertAtEach
阶段将并行工作。
[C]
[BC] [CB]
[ABC] [BCA] [BCA] [ACB] [CAB] [CBA]
CPU01 CPU02
即使我们使用大型初始列表(如 permute [0..9]
),它实际上在并行时也更慢。我们还没有弄清楚 withDegreeOfParallelism
和相关的 PSeq 选项是否有帮助。
这是其余的代码 list :
let put a q xs =
([], xs)
||> Seq.fold (fun acc x ->
if x = q then a::x::acc
else x::acc)
|> List.rev
// Insert x at each possible location in xs
let insertAtEach a xs =
([a::xs], xs)
||> Seq.fold (fun acc x ->
(put a x xs)::acc)
最佳答案
PSeq.fold
并不像您想象的那样。 PSeq.fold
实际上根本不是并行的。它是连续的。
您不能只是在算法中间的某个地方抛出“并行”一词并希望获得最好的结果。这不是并行化的工作方式。您必须真正了解正在发生的事情、并行发生的事情、顺序发生的事情、原则上可以并行化的事情以及不能并行化的事情。
以fold
为例:它将提供的折叠函数应用到序列的每个元素和上一次调用的结果。由于每个下一个调用在执行之前都必须有上一个调用的结果,很明显 fold
根本不能并行执行。必须是顺序的。事实上,如果您查看其 source code,这就是 PSeq.fold
实际执行的操作。 .因此,每次转换为 ParallelSequence
都会产生一些开销,但没有任何收获。
现在,如果您仔细查看您的算法,您可以梳理出可并行化的部分。你的算法做什么:
当你这样说时,很容易看出第 2 步实际上并不依赖于任何东西,只依赖于它本身。每个尾部排列都与所有其他排列完全分开处理。
当然,仅查看您的源代码并不能证明这一点,因为您已将步骤 2 和 3 合并到一个表达式 (insertAtEach xs.Head ps)@acc
中,但它是使用以下一般身份很容易梳理:
xs |> fold (fun a x -> g a (f x))
===
xs |> map f |> fold (fun a x -> g a x)
也就是说,在 fold
期间,不是将函数 f
应用于每个元素 x
,而是可以“提前”将它应用于每个元素"使用 map
。
将这个想法应用到你的算法中,你会得到:
let rec permute (xs:'t list) =
if xs.Length = 1 then [xs]
else permute xs.Tail
|> Seq.map (insertAtEach xs.Head)
|> Seq.fold (fun acc ps -> ps@acc) []
现在很容易看出 Seq.map
步骤是可并行化的步骤:map
独立于其他元素将函数应用于每个元素,因此 原则上可以并行工作。只需将 Seq
替换为 PSeq
即可获得并行版本:
let rec permute (xs:'t list) =
if xs.Length = 1 then [xs]
else permute xs.Tail
|> PSeq.map (insertAtEach xs.Head)
|> PSeq.fold (fun acc ps -> ps@acc) []
PSeq
是否确实并行执行 map
是另一回事,但这应该很容易根据经验进行验证。
事实上,在我的机器上,对于 7 到 10 个元素的列表(11 个元素的列表导致 OOM),并行版本始终优于顺序版本。
附言请记住,在测量时间时,您需要首先强制生成序列(例如,通过将其转换为列表或采用 Seq.last
)。否则,您要衡量的只是并行化开销成本。
关于parallel-processing - 为什么我们没有通过 PSeq 获得性能提升?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49523954/
在本教程中,您将通过示例学习 JavaScript。 JavaScript 中的提升是一种在声明之前可以使用函数或变量的行为。例如, // using test before declarin
我正在学习javascript提升功能,发现下面的代码真的很困惑: var a = 1; function b() { a = 10; return; function a()
作为一个JS学习者,我发现了一件很有趣的事情,考虑下面的代码。 this.init = function (e) { var container = e.container;
Quasiquotes 的 Scala 文档在解释 Lifting 时提到了这一点: One can also combine lifting and unquote splicing: scala
我是新来的。到目前为止,我一直在使用 MVC 模型并使用基本的 session 管理模型,即在 session 中存储一个 token 并检查每个请求。 我正在尝试对lift做同样的事情,但我的 se
我当前使用的是Elasticsearch 2.4版,希望根据查询时间的增加或加权,根据我称为“类型”的字段对结果集进行微调。 例如 如果字段“类型”的值为“船”,则将权重或增强值增加4 如果字段“类型
一年多以来,我一直在大量使用 lift、return 以及 EitherT、ReaderT< 等构造函数,等等。我读过《Real World Haskell》、《Learn You a Haskell
我浏览了电梯的MegaProtoUser遇到这种结构:??("Last Name")。谁能解释一下,这是什么意思? 谢谢解答 最佳答案 它是在对象 S 上定义的: def ??(str : Strin
我有一个Solr索引,每个文档都是一个Event的信息。在我的架构中,Schedule 是日期类型的多值字段。我想知道是否可以使用计划日期来增加文档(多值字段中的任何日期)在未来并且最接近当前日期?我
作为测试,我正在尝试使用设计人员友好的模板在 lift 中创建一个表单。我正在使用 Lift 2.5 我已经设法使用 toForm 创建了一个工作表单,但我只是在探索所有可能的方法。 我的 html
如果这个问题已经被问到,我深表歉意。 是否可以清除已经设置的条件变量? 下面是我想要实现的详细信息: void worker_thread { while (wait_for_conditio
尝试学习Js,无法理解为什么DOM元素没有获取到值: var Car = function(loc) { var obj = Object.create(Car.prototype); obj
我想知道吊装。我知道如果全局函数名称与全局变量相同,函数会覆盖变量的名称。是吗? 这是我的代码。 (function() { console.log('console.log#1 ' + glob
这个问题已经有答案了: var functionName = function() {} vs function functionName() {} (41 个回答) 已关闭 7 年前。 在javas
我正在开发 Windows 资源管理器 namespace 扩展。我的应用程序是explorer.exe在某个时候加载和使用的动态库。我需要我的 DLL 在 C:\中创建文件,有时在其他需要提升才能执
背景: GitHub 属于客户。我们团队中有一些新手,他们有时会错过基本的命名约定和其他编码协议(protocol)。所以,如果哪位前辈想在内部review,除了创建PR,别无他法。但是这个 PR 对
我们需要在运行时更改 HKEY_LOCAL_MACHINE 的一些设置。 如果需要在运行时,是否可以提示 uac 提升,或者我是否必须启动第二个提升的进程来完成“肮脏的工作”? 最佳答案 我会以提升的
看着Haskell文档,提升似乎基本上是 fmap 的概括,允许映射具有多个参数的函数。 Wikipedia然而,关于提升的文章给出了不同的观点,根据类别中的态射来定义“提升”,以及它如何与类别中的其
ggplot2 package 很容易成为我用过的最好的绘图系统,除了对于较大的数据集(约 50k 点)性能不是很好。我正在研究通过 Shiny 提供网络分析,使用 ggplot2作为绘图后端,但我对
是否可以提升 powershell 脚本的权限,以便没有管理员权限的用户可以运行该脚本?我们的网络管理员正在尝试寻找更省时的方法来完成某些任务,目前他们必须使用远程桌面...使用 PS 脚本将其自动化
我是一名优秀的程序员,十分优秀!