python - 如何在多个功能中最佳地使用 numba？-6ren

python - 如何在多个功能中最佳地使用 numba？

转载作者：行者123 更新时间：2023-12-04 07:45:33

25

4

假设我有两个功能

def my_sub1(a):
    return a + 2

def my_main(a):
    a += 1
    b = mysub1(a)
    return b

我想使用像 Numba 这样的即时编译器使它们更快。这是否会比我将所有内容重构为一个函数要慢

def my_main(a):
    a += 1
    b = a + 2
    return b

因为 Numba 可以在第二种情况下进行更深入的优化？当然，我的实际功能要复杂得多。
如果 my_sub1，整个情况也会变得更加困难。函数 get 被多次调用 - 重构(和维护将成为拖累)。 Numba 如何解决这个问题？

最佳答案

Tl;博士: Numba 能够内联其他 Numba 函数，并且仅在使用 native 类型时才执行相对高级的过程间优化(在这种情况下两个函数同样快)，但不适用于 Numpy 数组。

您可以分析 Numba 生成的结果汇编代码，以检查这两个函数是如何优化的。这是一个带有整数的示例:

import numba as nb

@nb.njit('int64(int64)')
def my_sub1(a):
    return a + 2

@nb.njit('int64(int64)')
def my_main(a):
    a += 1
    b = my_sub1(a)
    return b

open('my_sub1.asm', 'w').write(list(my_sub1.inspect_asm().values())[0])
open('my_main.asm', 'w').write(list(my_main.inspect_asm().values())[0])

这将生成两个程序集文件。如果你比较这两个文件，你会发现唯一的实际区别(除了不同的名称)是第一个做 addq $2, %rdx而第二个做 addq $3, %rdx .这意味着 Numba 成功地将调用内联到 my_sub1在 my_main并合并总和。这是汇编代码的重要部分:

_ZN8__main__12my_sub1$2413Ex:
    addq    $2, %rdx
    movq    %rdx, (%rdi)
    xorl    %eax, %eax
    retq

_ZN8__main__12my_main$2414Ex:
    addq    $3, %rdx
    movq    %rdx, (%rdi)
    xorl    %eax, %eax
    retq

对于 64 位浮点数，只要使用 fastmath=True，结果就相同。因为浮点加法不是结合的。
对于 Numpy 数组，生成的代码非常庞大，很难比较这两个代码。然而， my_sub1函数似乎不再内联，Numba 似乎无法合并 Numpy 计算(生成的代码中存在用于两个数组求和的两个不同的矢量化循环)。请注意，这与许多 C/C++ 编译器所做的类似。因此，最好在代码的性能关键部分自己内联函数。

关于python - 如何在多个功能中最佳地使用 numba？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67213549/

25

4

0

文章推荐： javascript - 无法触发 onClick 事件

文章推荐： c# - 如何在c#中使用IQueryable在动态查询中搜索日期

numba - 在 Numba 优化的 Python 中将类对象作为函数参数传递
我想将一个类对象传递给一个函数。我可以让它工作，但我想知道是否有我可以分配的类型？我有一个我正在尝试做的“最小”示例。 spec = [("a", float64),("b",float64)] @j
python - numba - 打字错误 : cannot determine Numba type of
我有一个简单的函数来对扑克手牌进行排序(手牌是字符串)。我用 rA,rB = rank(a),rank(b) 调用它，这是我的实现。没有 @jit(nopython=True) 也能很好地工作，但是
python - numpy 比 numba 和 cython 快，如何改进 numba 代码
我在这里有一个简单的例子来帮助我理解使用 numba 和 cython。我是 numba 和 cython 的新手。我已经尽力结合所有技巧来使 numba 更快，并且在某种程度上，cython 也是如
python - 如何使 numba @jit 使用所有 cpu 内核(并行化 numba @jit)
我正在使用 numbas @jit 装饰器在 python 中添加两个 numpy 数组。如果我使用 @jit 与 python 相比，性能是如此之高。然而，即使我传入 @numba.jit(nop
python - Numba jit nopython 模式 : tell numba the signature of an external arbitrary function
我需要为通用指标构建相异矩阵。由于我需要算法快速运行，所以我在 nopython 模式下使用了 numba 0.35。这是我的代码 import numpy as np from numba impo
python - Numba 支持 cuda 协作 block 同步？？ Python numba cuda 网格同步
Numba Cuda 有 syncthreads() 来同步一个 block 中的所有线程。如何在不退出当前内核的情况下同步网格中的所有 block ？在 C-Cuda 中有一个 cooperati
numba - 如何在协作室中使用numba
有人尝试在Google合作伙伴中使用numba吗？我只是不知道如何在此环境中进行设置。此刻，我陷入了错误library nvvm not found。最佳答案将此代码复制到单元格中。这个对我有用
python - Numba:回退到对象模式时抑制错误
我想编写一个函数，它既可以作为 jitted 函数运行，也可以作为普通 python 或对象模式 numba 运行，具体取决于 numba 是否能够进行类型推断。我实际上更喜欢普通的 python，但
list - Numba 从列表创建元组
我有一个非常简单的问题我无法解决。我正在使用 Numba 和 Cuda。我有一个列表 T=[1.0,2.0,3.0,4.0,5.0,6.0,7.0,8.0,9.0] 我想要一个包含列表元素的元组，如
python - Numba 没有提高性能
我正在测试一些采用 numpy 数组的函数的 numba 性能，并比较: import numpy as np from numba import jit, vectorize, float64 im
python - 插值 - Numba
我正在使用 Scipy 的 interpolate.interp1d 在 Python3 中插入一维数组。我想将它与 numba 一起使用，但不支持 scipy 和此功能。是否有 numba 支持
python - Numba 并行代码比顺序代码慢
我是 Numba 的新手，我正在尝试使用 Numba(版本 0.54.1)在 Python 中实现旧的 Fortran 代码，但是当我添加 parallel = True 时，程序实际上变慢了.我的程
python - Numba 的最佳可能位数组
我需要在 Python 中创建一个位数组。到目前为止，我发现可以使用 bitarray 生成非常节省内存的数组。模块。然而，我的最终目的是使用来自Numba 的@vectorize 装饰器。 . N
python - Numba - 字符串类型
我认为这是一个简单的问题，但我发现 numba 文档缺乏关于如何将字符串类型与 numpy 数组和字典一起使用的信息。我有一个我想使用 numba 的函数，它需要一个邮政编码列表，然后是一个映射邮政编
python - 如何在多个功能中最佳地使用 numba？
假设我有两个功能 def my_sub1(a): return a + 2 def my_main(a): a += 1 b = mysub1(a) return b
python - numba 编译逻辑比较中的性能损失
在以下用于逻辑比较的 numba 编译函数中，性能下降的原因可能是什么: from numba import njit t = (True, 'and_', False) #@njit(boolean
python - Numba 中的笛卡尔积
我的代码使用如下列表的笛卡尔积: import itertools cartesian_product = itertools.product(list('ABCDEF'), repeat=n) n可
gpu - Numba 中的组合矢量化函数
我正在使用 Numba(版本 0.37.0)来优化 GPU 代码。我想使用组合矢量化函数(使用 Numba 的 @vectorize 装饰器)。导入和数据: import numpy as np f
python - numba 中两个列表的交集
我想知道在 numba 函数中计算两个列表的交集的最快方法。只是为了澄清:两个列表的交集示例: Input : lst1 = [15, 9, 10, 56, 23, 78, 5, 4, 9] lst2
python - Numba 函数与类型参数的使用无效
我正在使用 Numba 非 python 模式和一些 NumPy 函数。 @njit def invert(W, copy=True): ''' Inverts elementwise

首页

博学

6Ren·AI

商城

python - 如何在多个功能中最佳地使用 numba？