multithreading - 在 SBCL 中进行多线程计算的正确方法

转载作者：行者123 更新时间：2023-12-01 11:15:31

26

4

上下文

我需要使用多线程进行计算。我使用 SBCL，可移植性不是问题。我知道 bordeaux-threads 和 lparallel 存在，但我想在特定 SBCL 线程实现提供的相对较低的级别上实现一些东西。我需要最大的速度，即使以牺牲可读性/编程工作量为代价。

计算密集型操作示例

我们可以定义一个足够计算密集型的函数，它将受益于多线程。

(defun intensive-sqrt (x)
  "Dummy calculation for intensive algorithm.
Approx 50 ms for 1e6 iterations."
  (let ((y x))
    (dotimes (it 1000000 t)
      (if (> y 1.01d0)
          (setf y (sqrt y))
          (setf y (* y y y))))
    y))

将每个计算映射到一个线程并执行

给定一个参数列表列表 llarg 和一个函数 fun，我们想要计算 nthreads 个结果并返回结果列表 资源列表。这是我使用找到的资源得出的结论(见下文)。

(defmacro splice-arglist-help (fun arglist)
  "Helper macro.
   Splices a list 'arglist' (arg1 arg2 ...) into the function call of 'fun'
   Returns (funcall fun arg1 arg2 ...)"
  `(funcall ,fun ,@arglist))

(defun splice-arglist (fun arglist)
  (eval `(splice-arglist-help ,fun ,arglist)))

(defun maplist-fun-multi (fun llarg nthreads)
  "Maps 'fun' over list of argument lists 'llarg' using multithreading.
   Breaks up llarg and feeds it to each thread.
   Appends all the result lists at the end."
  (let ((thread-list nil)
        (res-list nil))
    ;; Create and run threads
    (dotimes (it nthreads t)
      (let ((larg-temp (elt llarg it)))
        (setf thread-list (append thread-list
                                  (list (sb-thread:make-thread
                                         (lambda ()
                                           (splice-arglist fun larg-temp))))))))
    ;; Join threads
    ;; Threads are joined in order, not optimal for speed.
    ;; Should be joined when finished ?
    (dotimes (it (list-length thread-list) t)
      (setf res-list (append res-list (list (sb-thread:join-thread (elt thread-list it))))))
    res-list))

nthreads 不一定与 llarg 的长度匹配，但为了示例简单起见，我避免了额外的簿记。我还省略了用于优化的各种declare。

我们可以测试多线程并比较时序:

(defparameter *test-args-sqrt-long* nil)
(dotimes (it 10000 t)
  (push (list (+ 3d0 it)) *test-args-sqrt-long*))

(time (intensive-sqrt 5d0))
(time (maplist-fun-multi #'intensive-sqrt *test-args-sqrt-long* 100))

线程数相当多。我认为最佳方法是使用与 CPU 一样多的线程，但我注意到就时间/操作而言，性能下降几乎不明显。执行更多操作需要将输入列表分解成更小的部分。

以上代码在 2 核/4 线程机器上输出:

Evaluation took:
  0.029 seconds of real time
  0.015625 seconds of total run time (0.015625 user, 0.000000 system)
  55.17% CPU
  71,972,879 processor cycles
  22,151,168 bytes consed

Evaluation took:
  1.415 seconds of real time
  4.703125 seconds of total run time (4.437500 user, 0.265625 system)
  [ Run times consist of 0.205 seconds GC time, and 4.499 seconds non-GC time. ]
  332.37% CPU
  3,530,632,834 processor cycles
  2,215,345,584 bytes consed

我在烦恼什么

我给出的示例工作得很好并且很健壮(即结果不会在线程之间混淆，而且我没有遇到崩溃)。速度增益也在那里，计算确实在我测试过这段代码的机器上使用了多个内核/线程。但有几件事我希望得到意见/帮助:

参数列表llarg 和larg-temp 的使用。这真的有必要吗？有什么方法可以避免操纵可能庞大的列表？
线程按照它们在thread-list 中的存储顺序加入。我想如果每个操作都需要不同的时间来完成，这将不是最佳选择。有没有办法在每个线程完成时加入，而不是等待？

答案应该在我已经找到的资源中，但我发现更高级的东西很难理解。

目前找到的资源

最佳答案

文体问题

splice-arglist 助手根本不需要(所以我也将跳过其中的细节)。在线程函数中使用 apply 代替:
```
(lambda ()
  (apply fun larg-temp))
```
您不需要(也不应该)对列表进行索引，因为每次查找都是 O(n) — 您的循环是二次的。使用 dolist 进行简单的副作用循环，或者当你有 e 时使用 loop。 G。并行迭代:
```
(loop :repeat nthreads
      :for args :in llarg
      :collect (sb-thread:make-thread (lambda () (apply fun args))))
```
要在创建相同长度的新列表时遍历列表，其中每个元素都是根据源列表中的相应元素计算的，请使用 mapcar:
```
(mapcar #'sb-thread:join-thread threads)
```

你的函数因此变成:

(defun map-args-parallel (fun arglists nthreads)
  (let ((threads (loop :repeat nthreads
                       :for args :in arglists
                       :collect (sb-thread:make-thread
                                 (lambda ()
                                   (apply fun args))))))
    (mapcar #'sb-thread:join-thread threads)))

性能

您是对的，一个人通常只创建与 ca 一样多的线程。可用的核心数。如果您通过始终创建 n 个线程来测试性能，然后加入它们，然后转到下一批，您的性能确实不会有太大差异。那是因为效率低下在于创建线程。线程与进程一样占用大量资源。

人们通常做的是创建一个线程池，其中的线程不会被加入，而是被重用。为此，您需要一些其他机制来传达参数和结果，例如。 G。 channel (例如来自 chanl)。

但是请注意，e。 G。 lparallel 已经提供了一个 pmap 函数，而且它做的很对。此类包装器库的目的不仅是为用户(程序员)提供漂亮的界面，而且还需要认真思考问题并进行明智的优化。我非常有信心 pmap 会比您的尝试快得多。

关于multithreading - 在 SBCL 中进行多线程计算的正确方法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/51934045/

26

4

0

文章推荐： Python 3.6 类型检查 : numpy arrays and use defined classes

文章推荐： java - Maven war 插件出现格式错误的 pom 错误

文章推荐： r - bnlearn::bn.fit方法 "mle"和 "bayes"的区别和计算

服务器端的 Firebird 计算(计算)字段
SQL 和一般开发的新手，我有一个表(COUNTRIES)，其中包含字段(INDEX、NAME、POPULATION、AREA) 通常我添加一个客户端(Delphi)计算字段(DENSITY)和 On
jquery - 计算(百分比)计算(像素)
我想使用 calc(100%-100px)，但在我的 demo 中不起作用由于高度只接受像素，因此如何将此百分比值转换为像素。最佳答案以下将为您提供高度: $(window).height();
MySql 计算
我正在尝试在 MySQL 中添加列并动态填充其他列。例如我有一张表“数字”并具有第 1 列、第 2 列、第 3 列，这些总数应填充在第 4 列中最佳答案除非我误解了你的问题，否则你不只是在寻找:
mysql - 计算
我想返回简单计算的结果，但我不确定如何执行此操作。我的表格如下: SELECT COUNT(fb.engineer_id) AS `total_feedback`, SUM(fb.ra
嵌套for循环中的c++计算
我一直在尝试做这个程序，但我被卡住了，我仍然是一个初学者，任何帮助将不胜感激。我需要程序来做打印一个 10 X 10 的表格，其中表格中的每个条目都是行号和列号的总和包含一个累加器，用于计算所有表
c - 计算
这个计算背后一定有一些逻辑。但我无法得到它。普通数学不会导致这种行为。谁能帮我解释一下原因 printf ("float %f\n", 2/7 * 100.0); 结果打印 1.000000 为什么会
计算 AND 的算法
我想计算从 0 到 (n)^{1/2} - 1 的数字的 AND每个数字从 0 到 (n)^{1/2} - 1 .我想在 O(n) 中执行此操作时间，不能使用 XOR、OR、AND 运算。具体来说，
Excel - 在数字格式中使用公式/计算
如何在 Excel 中将公式放入自定义数字格式？例如(出于说明目的随机示例)，假设我有以下数据: 输入输出在不编辑单元格中的实际数据的情况下，我想显示单元格中的值除以 2，并保留两位小数: 有没
Flutter:隔离内存泄漏(计算)
每次我在 Flutter 应用程序中调用计算()时，我都会看到内存泄漏，据我所知，这基本上只是一种生成隔离的便捷方法。我的应用程序内存占用增加并且在 GC 之后永远不会减少。我已将我的代码简化为仅调
R中的RMSE(均方根偏差)计算
我有数字特征观察 V1通过 V12用于目标变量 Wavelength .我想计算 Vx 之间的 RMSE列。数据格式如下。每个变量“Vx”以 5 分钟的间隔进行测量。我想计算所有 Vx 变量的观测值
计算 C 文件中未知数量的字符
我正在寻找一种使用 C 语言计算文件中未知字符数的简单方法。谢谢你的帮助最佳答案 POSIX 方式(可能是您想要的方式): off_t get_file_length( FILE *file ) {
sql - 计算/派生连续日期跨度中的第一个开始日期
我正在使用 Postgres，并且我正试图围绕如何在连续日期跨度中得出第一个开始日期的问题进行思考。例如 :- ID | Start Date | End Date =================
jquery - 计算，用逗号替换点
我有一个订单表格，我在其中使用 jQuery 计算插件来汇总总数。此求和工作正常，但生成的“总和”存在问题。总之，我希望用逗号替换任何点。代码的基础是； function ($this) {
Delphi错误的 double 计算
我在使用 double 变量计算简单算术方程时遇到问题。我有一个具有 double 属性 Value 的组件，我将此属性设置为 100。然后我做一个简单的减法来检查这个值是否真的是 100: va
openssl CRC32 计算
我在这里看到了一些关于 CRC 32 计算的其他问题。但没有一个让我满意，因此是这样。 openssl 库是否有任何用于计算 CRC32 的 api 支持？我已经在为 SHA1 使用 openssl，
php - 计算-1个月时的PHP天错误
当我在PHP日期计算中遇到问题时，我感到惊讶。 $add = '- 30 days'; echo date('Y-m-01', strtotime($add)); // result is 2017-
持有变量的 JavaScript 计算
我正在使用 javascript 进行练习，我编写了这个脚本来计算 2 个变量的总和，然后在第三个方程中使用这个总和!关于如何完成这项工作的任何想法都将非常有用! First Number:
audio - sample 计算
我有一个来自EAC的提示单和一个包含完整专辑的FLAC文件。我正在尝试制作一些python脚本来播放文件，因为我需要能够设置在flac文件中开始的位置。如何从CueSheet格式MM:SS:FF转
javascript - 计算 for 循环中输入值的总和
这个问题已经有答案了: Adding two numbers concatenates them instead of calculating the sum (24 个回答) 已关闭去年。我有一个
使用输入和跨度字段的 Javascript 计算
4000 我需要上面字段 name="quantity" 和 id="price" 中的值，并使用 javascript 函数进行计算，并将其显示在字段 id= 中仅当我单击计算按钮时才显示“总

首页

博学

6Ren·AI

商城