cuda - @cuda.jit 和 @jit(target ='gpu') 的区别-6ren

cuda - @cuda.jit 和 @jit(target ='gpu') 的区别

转载作者：行者123 更新时间：2023-12-03 16:06:14

26

4

我有一个关于使用 Continuum 的 Accelerate 和 numba 包中的 Python CUDA 库的问题。正在使用装饰器@jit与 target = gpu同 @cuda.jit ?

最佳答案

不，它们不一样，尽管最终编译到 PTX 到汇编程序的路径是。 @jit装饰器是通用编译器路径，可以选择将其引导到 CUDA 设备上。 @cuda.jit装饰器实际上是 Continuum Analytics 开发的低级 Python CUDA 内核方言。因此，您可以获得对 CUDA 内置变量的支持，例如 threadIdx和内存空间说明符，如 __shared__在 @cuda.jit .

如果你想用 Python 编写一个 CUDA 内核并编译和运行它，使用 @cuda.jit .否则，如果您想加速现有的 Python 片段，请使用 @jit带有 CUDA 目标。

关于cuda - @cuda.jit 和 @jit(target ='gpu') 的区别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35890045/

26

4

0

文章推荐： cocoa - 使用 OpenGL 和 Cocoa 绘制文本的最佳方法？

jit - 动态语言是如何 JITted 的？
在动态语言中，动态类型代码 JIT 是如何编译成机器码的？更具体地说:编译器是否会在某个时候推断类型？还是在这些情况下严格解释？例如，如果我有类似下面的伪代码 def func(arg) i
jit - SPARC 体系结构是否仍然与高端服务器上的 JIT 编译器目标相关？
X86 和 AMD64 是许多计算环境(桌面、服务器和 super 计算机)最重要的架构。显然，JIT 编译器应该同时支持它们才能获得认可。直到最近，SPARC 架构才是编译器合乎逻辑的下一步，特别
jit - 将 JIT 转换为 EXE？
既然有如此多的 JIT 实现，每个 JIT 都会发出 native 代码。那么为什么没有人制作像 JIT2EXE 这样的工具来将 native 代码保存为 native 可执行文件呢？最佳答案这个
java - 为什么有 JIT 的解释器比没有 JIT 的解释器产生更快的代码？
JIT 编译器将字节码编译成机器码的概念我还是不太清楚。我想知道为什么它比非 JIT 解释器产生更快的代码。有人可以给我一个很好的例子来说明这个过程是如何完成的吗？最佳答案假设您有一个需要执行一百
pytorch - torchscript中的torch.jit.trace和torch.jit.script有什么区别？
Torchscript 提供了 torch.jit.trace 和 torch.jit.script 将 pytorch 代码从 Eager 模式转换为脚本模型。从文档中，我可以理解 torch.ji
jvm - 不要同时启用 JIT 和非 JIT 的解释器最终生成机器代码
好的，我已经阅读了一些关于 JIT 和非 JIT 启用解释器之间差异的讨论，以及为什么 JIT 通常会提高性能。但是，我的问题是: 最终，不支持 JIT 的解释器是否必须像 JIT 编译器那样将字节
java - 有没有一种方法可以在没有 JIT 开销的情况下实现 JIT 性能？
有没有办法在消除 JIT 开销的同时实现 JIT 性能？最好通过将类文件编译为 native 镜像。我研究过GCJ，但即使对于简单的程序，GCJ输出的性能也比Java JIT差很多。最佳答案您可
Java JIT 编译器优化 - JIT 在 volatile 变量值缓存方面是否一致？
我试图更好地理解 JIT 编译器在 volatile 变量值缓存方面如何为 java 工作。考虑这个问题中提出的例子: Infinite loop problem with while loop an
python - 从 numba jitted 函数调用非 jitted 函数
我的代码是这样的: @jit(nopython=True) def sum_fn(arg1, arg2, ...argn): ..... for i in xrange(len(arg
jit - 是否可以 jit 使用 jax.numpy.unique 的函数？
以下代码无效: def get_unique(arr): return jnp.unique(arr) get_unique = jit(get_unique) get_unique(jnp.
python - 是否可以调用间接调用另一个 cuda.jit 函数的 cuda.jit 函数？
我需要能够调用一个 GPU 函数，该函数本身间接调用另一个 GPU 函数: from numba import cuda, jit import numpy as np # GPU function
cuda - @cuda.jit 和 @jit(target ='gpu') 的区别
我有一个关于使用 Continuum 的 Accelerate 和 numba 包中的 Python CUDA 库的问题。正在使用装饰器@jit与 target = gpu同 @cuda.jit ?
java - JIT 去优化，原因 ="constraint"。为什么 JIT 会去优化方法？
有人可以指出我的方向，这可能会让我明白为什么 JIT 会取消优化我的循环？ (OSR)。看起来它被 C1 编译一次，然后多次取消优化(我可以看到数十或数百个以开头的日志) 这是包含该重要循环的类:
java - 带 JIT 和不带 JIT 的 JVM 之间的区别
我引用了Oracle的以下文档: http://docs.oracle.com/cd/E13150_01/jrockit_jvm/jrockit/geninfo/diagnos/underst_jit
python - pytorch torch.jit.trace 返回函数而不是 torch.jit.ScriptModule
我需要在 C++ 中运行预训练的 pytorch 神经网络模型(在 python 中训练)来进行预测。为此，我按照此处给出的有关如何在 C++ 中加载 pytorch 模型的说明进行操作:https
python - 如何使 numba @jit 使用所有 cpu 内核(并行化 numba @jit)
我正在使用 numbas @jit 装饰器在 python 中添加两个 numpy 数组。如果我使用 @jit 与 python 相比，性能是如此之高。然而，即使我传入 @numba.jit(nop
python - import Numba @jit meet warning message and @jit(nopython=True) 将显示错误
我是Python新手。我编写了一些代码尝试将图片混合为新图片。我完成了，但是浪费了太多时间。所以我尝试使用 Numba 让代码在我的 GPU 上运行。但遇到一些警告和错误 os Ubuntu 1
php - PHP 7 中的 "Allocation of JIT memory failed, PCRE JIT will be disabled"警告
我正在将我的网站从安装在共享网络托管帐户(在 DreamHost)上的 PHP v.5 转换为在 PHP 7.3.11 上运行。转换后，我开始注意到偶尔会收到以下警告: Warning: preg_m
jit - 及时编译总是更快？
在 Stack Overflow 上向所有编译器设计者致以问候。我目前正在从事一个项目，该项目的重点是开发一种用于高性能计算的新脚本语言。源代码首先被编译成字节码表示。字节码然后由运行时加载，它对其
第四次实现 JIT 写保护？
我相信 Apple 已禁止在 ARM64 架构上同时写入和执行内存，请参阅: 参见 mmap() RWX page on MacOS (ARM64 architecture)? 这使得像 jonesf

首页

博学

6Ren·AI

商城

cuda - @cuda.jit 和 @jit(target ='gpu') 的区别