python - numpy OpenBLAS 设置最大线程数-6ren

python - numpy OpenBLAS 设置最大线程数

转载作者：太空狗更新时间：2023-10-29 20:24:18

37

4

我正在使用 numpy，我的模型涉及密集的矩阵-矩阵乘法。为了加快速度，我使用 OpenBLAS 多线程库来并行化 numpy.dot 函数。

我的设置如下，

操作系统:CentOS 6.2 服务器 #CPUs = 12, #MEM = 96GB
python版本:Python2.7.6
numpy : numpy 1.8.0
OpenBLAS + IntelMKL

$ OMP_NUM_THREADS=8 python test_mul.py

代码，我从 https://gist.github.com/osdf/ 中获取的代码

test_mul.py :

import numpy
import sys
import timeit

try:
    import numpy.core._dotblas
    print 'FAST BLAS'
except ImportError:
    print 'slow blas'

print "version:", numpy.__version__
print "maxint:", sys.maxint
print

x = numpy.random.random((1000,1000))

setup = "import numpy; x = numpy.random.random((1000,1000))"
count = 5

t = timeit.Timer("numpy.dot(x, x.T)", setup=setup)
print "dot:", t.timeit(count)/count, "sec"

当我使用 OMP_NUM_THREADS=1 python test_mul.py 时，结果是

dot: 0.200172233582 sec

OMP_NUM_THREADS=2

dot: 0.103047609329 sec

OMP_NUM_THREADS=4

dot: 0.0533880233765 sec

一切顺利。

但是，当我设置 OMP_NUM_THREADS=8.... 代码开始“偶尔有效”。

有时它可以工作，有时它甚至不运行并给我核心转储。

当 OMP_NUM_THREADS > 10 时。代码似乎一直在中断..我想知道这里发生了什么？是否有类似每个进程可以使用的最大线程数的东西？鉴于我的机器中有 12 个 CPU，我可以提高该限制吗？

谢谢

最佳答案

首先，我不太明白“OpenBLAS + IntelMKL”是什么意思。这两个都是 BLAS 库，numpy 应该只在运行时链接到其中一个。您可能应该检查这两个 numpy 中的哪一个正在实际使用。您可以通过调用:

$ ldd <path-to-site-packages>/numpy/core/_dotblas.so

更新: numpy/core/_dotblas.so was removed in numpy v1.10 ，但您可以改为检查 numpy/core/multiarray.so 的链接。

例如，我链接到 OpenBLAS:

...
libopenblas.so.0 => /opt/OpenBLAS/lib/libopenblas.so.0 (0x00007f788c934000)
...

如果您确实链接到 OpenBLAS，您是否从源代码构建它？如果这样做，您应该会在 Makefile.rule 中看到一个注释选项:

...
# You can define maximum number of threads. Basically it should be
# less than actual number of cores. If you don't specify one, it's
# automatically detected by the the script.
# NUM_THREADS = 24
...

默认情况下，OpenBLAS 会尝试设置自动使用的最大线程数，但如果它未正确检测到这一点，您可以尝试取消注释并自行编辑此行。

另外，请记住，您可能会发现使用更多线程在性能方面的 yield 递减。除非您的数组非常大，否则使用超过 6 个线程不太可能显着提高性能，因为线程创建和管理所涉及的开销会增加。

关于python - numpy OpenBLAS 设置最大线程数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22418634/

37

4

0

文章推荐： C# 在 switch 语句中没有隐式失败

文章推荐： c++ - 我们怎样才能跳过 GDB 中的函数调用？

文章推荐： c++ - 在 C 中的硬盘驱动器上不存在文件的情况下写入文件流

文章推荐： c++ - 如何通过 QQmlListProperty 将列表模型分配给 QML ListView

python - Eigen + MKL 或 OpenBLAS 比 Numpy/Scipy + OpenBLAS 慢
我从 C++ atm 开始，希望使用矩阵并加快总体速度。之前使用过 Python+Numpy+OpenBLAS。认为 c++ + Eigen + MKL 可能更快或至少不慢。我的 C++ 代码: #
ubuntu - 通过 apt-get `sudo apt-get install openblas-dev` 安装 openblas
是否可以像 sudo apt-get install openblas-dev 这样通过 apt-get 安装 openblas？似乎在 ubuntu 14.04 上找不到它。 sudo apt-g
c++ - OpenBLAS 仅为一个例程设置线程数
在 C++17 中，我想使用多个 OpenBLAS 子程序，每个子程序具有不同的线程数。有什么办法可以做到这一点？过去，我使用过 openblas_set_num_threads();为我的 Ope
C++ 模板和 OpenBLAS
存在实现矩阵类型和计算的 C++ 库，例如 Eigen 或 Boost::uBlas。还有一些库，例如 LAPACK、Goto-BLAS、OpenBLAS 和 ATLAS，可在浮点类型上实现高度优化
c++ - OpenBLAS + MinGW64 静态链接？
我能够在 MinGW64 下编译 Armadillo + OpenBLAS，但是链接是通过“libopenblas”，我认为它是 dll。在 Ubuntu 下，我可以通过我认为是静态的“openbla
c++ - Armadillo + OpenBLAS 多线程
我在 Ubuntu 14.04 64 位的硕士论文中成功使用了 Armadillo 和 OpenBLAS(安装了 Armadillo 和没有安装)。性能非常出色——我的代码主要由基本矩阵运算组成。所有
linux - 在替代系统中安装 OpenBLAS 库
我编译了 OpenBLAS 并将其安装在/usr/lib/libopenblas现在我想在运行的替代系统中安装库 #!/bin/bash update-alternatives --install
c++ - OpenBlas 和 g++
我已经在 TX1 中安装了 OpenBlas，并且 time_dgemm 示例使用 gcc 编译得很好。但是，我需要能够使用 g++ 将其余代码与 OpenBlas 链接起来。当我尝试使用 g++ 编
python - numpy OpenBLAS 设置最大线程数
我正在使用 numpy，我的模型涉及密集的矩阵-矩阵乘法。为了加快速度，我使用 OpenBLAS 多线程库来并行化 numpy.dot 函数。我的设置如下，操作系统:CentOS 6.2 服务器
armadillo - 如何在编译期间强制 Armadillo 库链接到本地 OpenBLAS
我需要将 Armadillo (当前版本为 5.100.1)作为 $HOME 中的本地库(集群应用程序，不能安装在每个计算节点上，但 $HOME 是共享文件夹)。我正在使用 cmake 来管理应用程序
fortran - OpenBLAS 比内部函数 dot_product 慢
我需要用 Fortran 制作一个点积。我可以使用内在函数 dot_product来自 Fortran 或使用 ddot来自 OpenBLAS。问题是 ddot 速度较慢。这是我的代码: 使用BLAS
java - 如何检查 Spark 是否使用 OpenBlas？
我最近下载并构建了 Spark 2.3.1。我使用这些命令下载并选择版本 2.3.1 git clone https://github.com/apache/spark.git cd spark
c++ - 使用 msys2 构建 OpenBlas
我有一台 Windows 7-64 位计算机，我正在尝试通过 Msys2 构建 OpenBlas 库。 gcc 似乎存在一些问题，因为在安装 minGW 和解压缩的 OpenBlas 文件夹后，我打开
c - OpenBLAS sgemm，特殊要求？有时我得到南
我的标题中某处有此声明: typedef float real; typedef int integer; extern "C" { extern int sgemm_(char *transa, c
c++ - 如何将 C++ 链接到 OpenBlas？
我安装了 OpenBlas 并且可以通过使用编译链接到 OpenBlas 的 C 程序 gcc testOpenBlas.c -I /opt/OpenBLAS/include/ -L/opt/Op
python - 在 numpy/openblas 上设置运行时的最大线程数
我想知道是否可以在(Python)运行时更改 OpenBLAS 在 numpy 后面使用的最大线程数？我知道可以在通过环境变量 OMP_NUM_THREADS 运行解释器之前设置它，但我想在运行时更
python - 使用 OpenBLAS 集成编译 numpy
我正在尝试使用 OpenBLAS 安装 numpy ，但是我不知道如何编写 site.cfg 文件. 当installation procedure随后安装完成且没有错误，但是将 OpenBLAS 使
macos - 如何在 OSX Mavericks 上构建 OpenBLAS
我正在尝试在 OSX Mavericks 上构建 OpenBLAS ( http://www.openblas.net/ ) 只需键入“make”，它就会在 make 过程的几分钟内遇到错误。我已经
cmake - CMake FindBLAS 可以找到 OpenBLAS 吗？
为了演示，我使用 3 行 CMakeLists.txt: cmake_minimum_required(VERSION 2.8) find_package( BLAS REQUIRED ) messa
c++ - 如何在 CMake 中将 OpenBLAS 定义为子目录？
我正在使用OpenBLAS我的 BLAS和 LAPACK例行通话。我不想要我的 C++ 的用户群库必须在他们的机器上安装依赖项。所以我想提供OpenBLAS我的图书馆 third_party并有 CM

首页

博学

6Ren·AI

商城

python - numpy OpenBLAS 设置最大线程数