Python Numba/jit 条件和递归(堆栈)使用-6ren

Python Numba/jit 条件和递归(堆栈)使用

转载作者：太空狗更新时间：2023-10-30 02:30:01

24

4

全部，

我正在使用 numba JIT 来加速我的 Python 代码，但即使没有安装 numba 和 LLVM，代码也应该可以正常运行。

我的第一个想法是按如下方式进行:

use_numba = True
try:
    from numba import jit, int32
except ImportError, e:
    use_numba = False

def run_it(parameters):
    # do something
    pass

# define wrapper call function with optimizer
@jit
def run_it_with_numba(parameters):
    return run_it(parameters)

# [...]
# main program 
t_start = timeit.default_timer()

# this is the code I don't like 
if use_numba:
    res = run_it_with_numba(parameters)
else:
    res = run_it(parameters)

t_stop = timeit.default_timer()
print "Numba: ", use_numba, " Time: ", t_stop - t_start

这并没有像我预期的那样工作，因为编译似乎只适用于 run_it_with_numba() 函数——它基本上什么都不做——但不适用于从该函数调用的子例程。

只有当我在包含工作负载的函数上应用 @jit 时，结果才会变得更好。

有没有机会在主程序中避免包装函数和 if 子句？

有没有办法告诉 Numba 优化从我的入口函数调用的子例程？因为 run_it() 还包含一些函数调用，我希望 @jit 能够处理它。

铜，麦酒

最佳答案

如果没有安装 Numba，你可以提供一个什么都不做的 jit 版本:

use_numba = True
try:
    from numba import jit, int32
except ImportError, e:
    use_numba = False
    from _shim import jit, int32

@jit
def run_it(parameters):
    # do something
    pass

# [...]
# main program 
t_start = timeit.default_timer()

res = run_it(eval(row[0]), workfeed, instrument)

t_stop = timeit.default_timer()
print "Numba: ", use_numba, " Time: ", t_stop - t_start

_shim.py 只包含:

def jit(*args, **kwargs):
    def wrapper(f):
        return f
    if len(args) > 0 and (args[0] is marker or not callable(args[0])) \
        or len(kwargs) > 0:
        # @jit(int32(int32, int32)), @jit(signature="void(int32)")
        return wrapper
    elif len(args) == 0:
        # @jit()
        return wrapper
    else:
        # @jit
        return args[0]

def marker(*args, **kwargs): return marker

int32 = marker

关于Python Numba/jit 条件和递归(堆栈)使用，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29587317/

24

4

0

文章推荐： python - 将 RoleNeed 与 Flask Principal 相结合

文章推荐： python - 计算 DataFrame Pandas 中 'times' 行之间的差异

文章推荐： python - 使用请求将文件上传到 python-eve

文章推荐： python - 为什么 setuptools 不复制子文件夹中的模块？

jit - 动态语言是如何 JITted 的？
在动态语言中，动态类型代码 JIT 是如何编译成机器码的？更具体地说:编译器是否会在某个时候推断类型？还是在这些情况下严格解释？例如，如果我有类似下面的伪代码 def func(arg) i
jit - SPARC 体系结构是否仍然与高端服务器上的 JIT 编译器目标相关？
X86 和 AMD64 是许多计算环境(桌面、服务器和 super 计算机)最重要的架构。显然，JIT 编译器应该同时支持它们才能获得认可。直到最近，SPARC 架构才是编译器合乎逻辑的下一步，特别
jit - 将 JIT 转换为 EXE？
既然有如此多的 JIT 实现，每个 JIT 都会发出 native 代码。那么为什么没有人制作像 JIT2EXE 这样的工具来将 native 代码保存为 native 可执行文件呢？最佳答案这个
java - 为什么有 JIT 的解释器比没有 JIT 的解释器产生更快的代码？
JIT 编译器将字节码编译成机器码的概念我还是不太清楚。我想知道为什么它比非 JIT 解释器产生更快的代码。有人可以给我一个很好的例子来说明这个过程是如何完成的吗？最佳答案假设您有一个需要执行一百
pytorch - torchscript中的torch.jit.trace和torch.jit.script有什么区别？
Torchscript 提供了 torch.jit.trace 和 torch.jit.script 将 pytorch 代码从 Eager 模式转换为脚本模型。从文档中，我可以理解 torch.ji
jvm - 不要同时启用 JIT 和非 JIT 的解释器最终生成机器代码
好的，我已经阅读了一些关于 JIT 和非 JIT 启用解释器之间差异的讨论，以及为什么 JIT 通常会提高性能。但是，我的问题是: 最终，不支持 JIT 的解释器是否必须像 JIT 编译器那样将字节
java - 有没有一种方法可以在没有 JIT 开销的情况下实现 JIT 性能？
有没有办法在消除 JIT 开销的同时实现 JIT 性能？最好通过将类文件编译为 native 镜像。我研究过GCJ，但即使对于简单的程序，GCJ输出的性能也比Java JIT差很多。最佳答案您可
Java JIT 编译器优化 - JIT 在 volatile 变量值缓存方面是否一致？
我试图更好地理解 JIT 编译器在 volatile 变量值缓存方面如何为 java 工作。考虑这个问题中提出的例子: Infinite loop problem with while loop an
python - 从 numba jitted 函数调用非 jitted 函数
我的代码是这样的: @jit(nopython=True) def sum_fn(arg1, arg2, ...argn): ..... for i in xrange(len(arg
jit - 是否可以 jit 使用 jax.numpy.unique 的函数？
以下代码无效: def get_unique(arr): return jnp.unique(arr) get_unique = jit(get_unique) get_unique(jnp.
python - 是否可以调用间接调用另一个 cuda.jit 函数的 cuda.jit 函数？
我需要能够调用一个 GPU 函数，该函数本身间接调用另一个 GPU 函数: from numba import cuda, jit import numpy as np # GPU function
cuda - @cuda.jit 和 @jit(target ='gpu') 的区别
我有一个关于使用 Continuum 的 Accelerate 和 numba 包中的 Python CUDA 库的问题。正在使用装饰器@jit与 target = gpu同 @cuda.jit ?
java - JIT 去优化，原因 ="constraint"。为什么 JIT 会去优化方法？
有人可以指出我的方向，这可能会让我明白为什么 JIT 会取消优化我的循环？ (OSR)。看起来它被 C1 编译一次，然后多次取消优化(我可以看到数十或数百个以开头的日志) 这是包含该重要循环的类:
java - 带 JIT 和不带 JIT 的 JVM 之间的区别
我引用了Oracle的以下文档: http://docs.oracle.com/cd/E13150_01/jrockit_jvm/jrockit/geninfo/diagnos/underst_jit
python - pytorch torch.jit.trace 返回函数而不是 torch.jit.ScriptModule
我需要在 C++ 中运行预训练的 pytorch 神经网络模型(在 python 中训练)来进行预测。为此，我按照此处给出的有关如何在 C++ 中加载 pytorch 模型的说明进行操作:https
python - 如何使 numba @jit 使用所有 cpu 内核(并行化 numba @jit)
我正在使用 numbas @jit 装饰器在 python 中添加两个 numpy 数组。如果我使用 @jit 与 python 相比，性能是如此之高。然而，即使我传入 @numba.jit(nop
python - import Numba @jit meet warning message and @jit(nopython=True) 将显示错误
我是Python新手。我编写了一些代码尝试将图片混合为新图片。我完成了，但是浪费了太多时间。所以我尝试使用 Numba 让代码在我的 GPU 上运行。但遇到一些警告和错误 os Ubuntu 1
php - PHP 7 中的 "Allocation of JIT memory failed, PCRE JIT will be disabled"警告
我正在将我的网站从安装在共享网络托管帐户(在 DreamHost)上的 PHP v.5 转换为在 PHP 7.3.11 上运行。转换后，我开始注意到偶尔会收到以下警告: Warning: preg_m
jit - 及时编译总是更快？
在 Stack Overflow 上向所有编译器设计者致以问候。我目前正在从事一个项目，该项目的重点是开发一种用于高性能计算的新脚本语言。源代码首先被编译成字节码表示。字节码然后由运行时加载，它对其
第四次实现 JIT 写保护？
我相信 Apple 已禁止在 ARM64 架构上同时写入和执行内存，请参阅: 参见 mmap() RWX page on MacOS (ARM64 architecture)? 这使得像 jonesf

首页

博学

6Ren·AI

商城

Python Numba/jit 条件和递归(堆栈)使用