multithreading - Julia (1.3) 中斐波那契数列的多线程并行性能问题-6ren

multithreading - Julia (1.3) 中斐波那契数列的多线程并行性能问题

转载作者：行者123 更新时间：2023-12-03 21:50:09

25

4

我正在尝试Julia 1.3的多线程功能使用以下硬件:

Model Name: MacBook Pro
Processor Name: Intel Core i7
Processor Speed:    2.8 GHz
Number of Processors:   1
Total Number of Cores:  4
L2 Cache (per Core):    256 KB
L3 Cache:   6 MB
Hyper-Threading Technology: Enabled
Memory: 16 GB

运行以下脚本时:

function F(n)
if n < 2
    return n
    else
        return F(n-1)+F(n-2)
    end
end
@time F(43)

它给了我以下输出

2.229305 seconds (2.00 k allocations: 103.924 KiB)
433494437

但是，当运行从 Julia page about multithreading 复制的以下代码时

import Base.Threads.@spawn

function fib(n::Int)
    if n < 2
        return n
    end
    t = @spawn fib(n - 2)
    return fib(n - 1) + fetch(t)
end

fib(43)

发生的情况是 RAM/CPU 的利用率从 3.2GB/6% 跃升至 15GB/25% 没有任何输出(至少 1 分钟，之后我决定终止 julia session )

我究竟做错了什么？

最佳答案

好问题。
斐波那契函数的这种多线程实现并不比单线程版本快。该功能仅在博客文章中作为新线程功能如何工作的玩具示例显示，强调它允许在不同功能中生成许多线程，并且调度程序将找出最佳工作负载。
问题是 @spawn具有大约 1µs 的非平凡开销，所以如果你生成一个线程来完成一个花费少于 1µs 的任务，你可能已经损害了你的表现。 fib(n) 的递归定义具有指数级时间复杂度 1.6180^n [1]，所以当您调用 fib(43) ，你产生了一些秩序1.6180^43线程。如果每一张都取1µs要生成，仅生成和调度所需的线程大约需要 16 分钟，这甚至不考虑进行实际计算和重新合并/同步线程所需的时间，这需要更多时间。
只有当计算的每个步骤与 @spawn 相比，计算的每个步骤都需要很长时间时，才会为计算的每个步骤生成一个线程这样的事情才有意义。高架。
请注意，减少 @spawn 的开销还有很多工作要做。，但是根据多核硅芯片的物理特性，我怀疑它对于上述 fib 的速度是否足够快执行。

如果您对我们如何修改线程 fib 感到好奇函数实际上是有益的，最简单的事情就是只产生一个 fib如果我们认为这将花费比 1µs 更长的时间，请跟帖运行。在我的机器上(在 16 个物理内核上运行)，我得到

function F(n)
    if n < 2
        return n
    else
        return F(n-1)+F(n-2)
    end
end


julia> @btime F(23);
  122.920 μs (0 allocations: 0 bytes)

所以这比产生线程的成本高出两个数量级。这似乎是一个很好的使用截止点:

function fib(n::Int)
    if n < 2
        return n
    elseif n > 23
        t = @spawn fib(n - 2)
        return fib(n - 1) + fetch(t)
    else
        return fib(n-1) + fib(n-2)
    end
end

现在，如果我使用 BenchmarkTools.jl [2] 遵循适当的基准测试方法，我会发现

julia> using BenchmarkTools

julia> @btime fib(43)
  971.842 ms (1496518 allocations: 33.64 MiB)
433494437

julia> @btime F(43)
  1.866 s (0 allocations: 0 bytes)
433494437

@Anush 在评论中询问:这似乎是使用 16 个内核的 2 倍加速。是否有可能获得接近 16 倍的加速？
是的。上面函数的问题是函数体大于 F ，有很多条件，函数/线程生成等等。我邀请你比较 @code_llvm F(10) @code_llvm fib(10) .这意味着 fib Julia 更难优化。这个额外的开销对于小的 n 来说是天壤之别。案例。

julia> @btime F(20);
  28.844 μs (0 allocations: 0 bytes)

julia> @btime fib(20);
  242.208 μs (20 allocations: 320 bytes)

不好了! n < 23 的所有额外代码永远不会被触及正在使我们减速一个数量级!不过有一个简单的解决方法:当 n < 23 , 不要递归到 fib , 而是调用单线程 F .

function fib(n::Int)
    if n > 23
       t = @spawn fib(n - 2)
       return fib(n - 1) + fetch(t)
    else
       return F(n)
    end
end

julia> @btime fib(43)
  138.876 ms (185594 allocations: 13.64 MiB)
433494437

这使得结果更接近我们对这么多线程的期望。
[1] https://www.geeksforgeeks.org/time-complexity-recursive-fibonacci-program/
[2] 基准工具 @btime BenchmarkTools.jl 中的宏将多次运行函数，跳过编译时间和平均结果。

关于multithreading - Julia (1.3) 中斐波那契数列的多线程并行性能问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59078305/

25

4

0

文章推荐： c# - 如何在单元测试中设置自动增量 ID

文章推荐：已删除节点上的 Cassandra opscenter "agents failed to connect"

文章推荐： c# - 我的路线没有启动，这应该有效吗？

文章推荐： .net - 什么阻止收集 C# 中的线程？

multithreading - Lua-如何模拟 “multithreading”？
我有2个功能: function func1() while true do -- listen on connection end end function func2()
multithreading - clojure 是 "multithread"吗？
我的问题可能看起来很奇怪，但我想我正面临着 volatile 的问题。对象。我写了一个这样实现的库(只是一个方案，不是真正的内容): (def var1 (volatile! nil)) (def
multithreading - Maven Sonarqube 插件 : Multithreading
由于 maven 支持多线程构建，是否可以同时运行 Sonar 多线程？ (例如 mvn sonar:sonar -T 4 ) 我运行了它，当模块报告成功时，它报告整个构建失败并返回 java.uti
multithreading - Java : Running transaction in multithreaded environment
我们正在启动一个网站，该网站在短时间内的交易量非常大。它基本上是在给票。该代码是用Java，Spring和Hibernate编写的。我想通过产生多个线程并尝试使用JUnit测试用例来获取票证来模仿高容
multithreading - 虚幻引擎4 : Adapting ReadPixels() to a multithreaded framework
我正在尝试访问像素数据并将图像从游戏中的相机保存到磁盘。最初，简单的方法是使用渲染目标，然后使用RenderTarget-> ReadPixels()，但是由于ReadPixels()的 native
multithreading - Mahout优化: Multithreading TopItems. getTopUsers()和TopItems.getTopItems()
我们有以下系统: 用户数:〜500k 项目数:〜100k UserSimilarity userSimilarity = new TanimotoCoefficientSimilarity(dataM
multithreading - Spring 批处理 : problems (mix data) when converting to multithread
也许这是一个经常出现的问题，但我需要根据我的上下文进行一些自定义。我正在使用 Spring Batch 3.0.1.RELEASE 我有一个简单的工作，有一些步骤。一个步骤是这样的 block :
multithreading - Spring 批处理 : problems (mix data) when converting to multithread
也许这是一个经常出现的问题，但我需要根据我的上下文进行一些自定义。我正在使用 Spring Batch 3.0.1.RELEASE 我有一个简单的工作，有一些步骤。一个步骤是这样的 block :
multithreading - Python : multithreaded learning neural networks using PyBrain and Multiprocessing
我正在尝试使用PyBrain和Python的multiprocessing软件包在Python中训练神经网络。这是我的代码(它训练了一个简单的神经网络来学习XOR逻辑)。 import pybrai
multithreading - Adobe Air AS3 :How to run a function in workers_ Multithreading (by Workers)
我有一个繁重的功能，不适合在主时间轴上执行(因为要花很长时间才能完成并使程序崩溃)。因此我在air(as3)中搜索多线程，但是我发现的所有示例都说明了如何在worker中运行单独的swf文件。如何在
multithreading - Flutter Dart : How can we achieve multithreading like python or java in dart
我想实现线程A 和线程B 并行运行并共享全局变量。下面是用python编写的代码。我想在中执行相同操作Dart (我不想使用future等待，因为它正在等待其他线程完成或必须等待。) 大小写变量:
c++ - Visual Studio C++ "Multithreaded Debug DLL"与 "Multithreaded DLL"
我的一个项目只适用于调试 DLL，而不适用于非调试 DLL。在 Debug DLL 设置下发布项目有哪些注意事项？例如，是否丢失了某些优化？如何通过将调试版本设置为非调试 DLL 来调试此项目？我
multithreading - 线性系统求解器在 Julia 中是否也像在 Matlab 中一样是多线程的？以及如何在 Julia 中对其进行 "multithread"处理？
我正在尝试比较 Matlab 和 Julia 之间的速度和性能。我正在查看一个代码，该代码对承受给定负载的连续体结构进行拓扑优化。我正在查看的代码是公共(public)代码topopt88.m:htt
python - 引发 ValueError ("cannot have a multithreaded and multi process server.") ValueError : cannot have a multithreaded and multi process server
Serving Flask 应用程序“服务器”(延迟加载) 环境:生产警告:这是一个开发服务器。不要在生产部署中使用它。请改用生产 WSGI 服务器。 Debug模式:开启在 http://0.0.
multithreading - 如何通过调用另一个函数的QThread更新PyQT中的Progressbar
我对 PyQT 很陌生。我正在学习如何制作 Progressbar 并随着算法的进展对其进行更新。我已经能够制作一个使用此链接进行 self 更新的基本进度条:Python pyqt pulsing
multithreading - 将任务添加到特定线程的队列中
我正在尝试指定在特定线程上运行任务，这样我就可以使用两个专用于“放入” channel 的耗时任务的线程，而其他线程则用于处理该任务。我对如何将特定任务分配给特定线程感到困惑。我以为我可以使用类似
multithreading - QT多线程QImage改变
我正在编写一个软件，它对很多(潜在的大)图像进行大量图像操作/合成。多线程有助于提高速度，但 QT 不允许同时在同一图像上使用多个 QPainter。所以我必须在副本的每个线程中进行图像操作/合成
multithreading - 用数组请求多线程
此脚本读取 url 文件以执行多线程 HTTP 请求。如何使用带有 url 的数组来发出多线程请求？我的阵列将有类似的东西: @array = ("https://example.com/xsd"
multithreading - 构造函数中的过早泄漏
Java 文档声明了以下关于构造函数同步的内容: Note that constructors cannot be synchronized — using the synchronized keyw
multithreading - 调试核心文件时找到主线程
我有一个程序，其中主线程创建了很多线程。它崩溃了，我正在调试核心文件。崩溃发生在其中一个子线程中。为了找到原因，我需要知道主线程是否还活着。有什么方法可以找出哪个线程是初始线程？最佳答案 Is th

首页

博学

6Ren·AI

商城

multithreading - Julia (1.3) 中斐波那契数列的多线程并行性能问题