- r - 以节省内存的方式增长 data.frame
- ruby-on-rails - ruby/ruby on rails 内存泄漏检测
- android - 无法解析导入android.support.v7.app
- UNIX 域套接字与共享内存(映射文件)
我希望能够使用 gnu octave 对多线程进行编程,这样它将利用多个处理器。
我在 Fedora 17 Linux 上安装了 GNU Octave 并执行了以下操作:
yum install octave
在我的电脑上安装了最新版本的 Octave,3.6.2。它工作得很好,但是当你将两个巨大的矩阵相乘时,它会使 Octave 使用的一个 CPU 陷入困境。如果矩阵乘法利用所有内核,那就太好了,因为在这种情况下,CPU 显然是瓶颈。
octave能否充分利用多核处理器,多线程运行?是否有用于此的库或编译时标志?
最佳答案
解决方案
Octave 本身是一个运行在一个内核上的单线程应用程序。您可以使用 Octave 来使用 ATLAS 等利用多核的库。因此,虽然 Octave 仅使用一个核心,但当您遇到繁重的操作时,Octave 会调用 ATLAS 中使用许多 CPU 的函数。
我能够做到这一点。首先从源代码编译“ATLAS”并使其可供您的系统使用,以便 octave 可以找到它并使用这些库函数。 ATLAS 会根据您的系统和内核数量进行 self 调整。当您从源代码安装 octave 并指定 ATLAS 时,它会使用它,因此当 octave 执行繁重的操作(如巨大的矩阵乘法)时,ATLAS 决定使用多少个 cpu。
我无法让它在 Fedora 上运行,但在 Gentoo 上我可以让它运行。
我使用了这两个链接: ftp://ftp.gnu.org/gnu/octave/
http://math-atlas.sourceforge.net/
我在 ATLAS 安装前后运行了以下 Octave 核心:
tic
bigMatrixA = rand(3000000,80);
bigMatrixB = rand(80,30);
bigMatrixC = bigMatrixA * bigMatrixB;
toc
disp("done");
矩阵乘法在使用多个处理器时速度更快,比以前使用单核处理器快 3 倍:
Without Atlas: Elapsed time is 3.22819 seconds.
With Atlas: Elapsed time is 0.529 seconds.
我正在使用的三个加快速度的库是blas-atlas
,cblas-atlas
,lapack-atlas
.
如果 Octave 可以使用这些而不是默认的 blas 和 lapack 库,那么它将利用多核。
使用 ATLAS 从源代码编译 Octave 并不容易,需要一些编程技巧。
使用 Atlas 的缺点:
此 Atlas 软件使用大量开销将您的 Octave 程序拆分为多个线程。当然,如果你所做的只是巨大的矩阵乘法,它会更快,但大多数命令不能被 atlas 多线程处理。如果从核心中提取每一点处理能力/速度是重中之重,那么只需编写与自身并行运行的程序,你就会有更好的运气。 (将你的程序分成 8 个等效程序,处理 1/8 的问题并同时运行它们,当所有完成后,重新组合结果)。
Atlas 帮助单线程 Octave 程序表现得更像多线程应用程序,但它不是 Elixir 。 Atlas 不会使您的单线程 Octave 程序最大化您的 2、4、6、8 核心处理器。您会注意到性能提升,但这种提升会让您寻找更好的方式来使用所有处理器。答案是编写与自身并行运行的程序,这需要大量的编程技巧。
建议
将您的精力投入到对您最繁重的操作进行矢量化处理并将流程分布到 n 个同时运行的线程上。如果您等待某个进程运行的时间过长,最有可能实现加速的最简单方法是使用更高效的算法或数据结构。
关于linux - 让 GNU Octave 与多核处理器一起工作。 (多线程),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11889118/
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
Linux 管道可以缓冲多少数据?这是可配置的吗? 如果管道的两端在同一个进程中,但线程不同,这会有什么不同吗? 请注意:这个“同一个进程,两个线程”的问题是理论上的边栏,真正的问题是关于缓冲的。 最
我找到了here [最后一页] 一种有趣的通过 Linux 启动 Linux 的方法。不幸的是,它只是被提及,我在网上找不到任何有用的链接。那么有人听说过一种避免引导加载程序而使用 Linux 的方法
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我试图了解 ld-linux.so 如何在 Linux 上解析对版本化符号的引用。我有以下文件: 测试.c: void f(); int main() { f(); } a.c 和 b.c:
与 RetroPie 的工作原理类似,我可以使用 Linux 应用程序作为我的桌面环境吗?我实际上并不需要像实际桌面和安装应用程序这样的东西。我只需要一种干净简单的方法来在 RaspberryPi 上
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 10 年前。 Improve thi
有什么方法可以覆盖现有的源代码,我应该用 PyQt、PyGTK、Java 等从头开始构建吗? 最佳答案 如果您指的是软件本身而不是它所连接的存储库,那么自定义应用程序的方法就是 fork 项目。据我所
我的情况是:我在一个磁盘上安装了两个 linux。我将第一个安装在/dev/sda1 中,然后在/dev/sda2 中安装第二个然后我运行第一个系统,我写了一个脚本来在第一个系统运行时更新它。
我在 i2c-0 总线上使用地址为 0x3f 的系统监视器设备。该设备在设备树中配置有 pmbus 驱动程序。 问题是,加载 linux 内核时,这个“Sysmon”设备没有供电。因此,当我在总线 0
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 关闭 11 年前。 Improve thi
我正试图在 linux 模块中分配一大块内存,而 kalloc 做不到。 我知道唯一的方法是使用 alloc_bootmem(unsigned long size) 但我只能从 linux 内核而不是
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a softwar
我有 .sh 文件来运行应用程序。在该文件中,我想动态设置服务器名称,而不是每次都配置。 我尝试了以下方法,它在 CentOS 中运行良好。 nohup /voip/java/jdk1.8.0_71/
我是在 Linux 上开发嵌入式 C++ 程序的新手。我有我的 Debian 操作系统,我在其中开发和编译了我的 C++ 项目(一个简单的控制台进程)。 我想将我的应用程序放到另一个 Debian 操
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 4 年前。 Improve this ques
我使用4.19.78版本的稳定内核,我想找到带有企鹅二进制数据的C数组。系统启动时显示。我需要在哪里搜索该内容? 我在 include/linux/linux_logo.h 文件中只找到了一些 Log
我知道可以使用 gdb 的服务器模式远程调试代码,我知道可以调试针对另一种架构交叉编译的代码,但是是否可以更进一步,从远程调试 Linux 应用程序OS X 使用 gdbserver? 最佳答案 当然
是否有任何可能的方法来运行在另一个 Linux 上编译的二进制文件?我知道当然最简单的是在另一台机器上重建它,但假设我们唯一能得到的是一个二进制文件,那么这可能与否? (我知道这可能并不容易,但我只是
我是一名优秀的程序员,十分优秀!