python - Pycuda - 如何添加-ccbin clang-3.8-6ren

python - Pycuda - 如何添加-ccbin clang-3.8

转载作者：行者123 更新时间：2023-12-01 02:02:30

29

4

我目前正在尝试在 Debian 9 上使用 PyCUDA。我已经设法使 cuda 工作，如果我运行:

nvcc -ccbin clang-3.8 file.cu

我正确编译了该文件并且能够运行它。

但是，在我使用

安装了 pycuda 之后

apt-get install python-pycuda

并从他们的网站运行一个简单的示例:

import pycuda.autoinit
import pycuda.driver as drv
import numpy

from pycuda.compiler import SourceModule
mod = SourceModule("""
__global__ void multiply_them(float *dest, float *a, float *b)
{
   const int i = threadIdx.x;
   dest[i] = a[i] * b[i];
}
""")

multiply_them = mod.get_function("multiply_them")

a = numpy.random.randn(400).astype(numpy.float32)
b = numpy.random.randn(400).astype(numpy.float32)

dest = numpy.zeros_like(a)
multiply_them(
         drv.Out(dest), drv.In(a), drv.In(b),
         block=(400,1,1), grid=(1,1))
print dest-a*b

但我收到以下错误:

CompileError                              Traceback (most recent call last)
<ipython-input-1-8e16128de7f2> in <module>()
     10   dest[i] = a[i] * b[i];
     11 }
---> 12 """)
     13 
     14 multiply_them = mod.get_function("multiply_them")

/usr/lib/python2.7/dist-packages/pycuda/compiler.pyc in __init__(self, source, nvcc, options, keep, no_extern_c, arch, code, cache_dir, include_dirs)
    263 
    264         cubin = compile(source, nvcc, options, keep, no_extern_c,
--> 265                 arch, code, cache_dir, include_dirs)
    266 
    267         from pycuda.driver import module_from_buffer

/usr/lib/python2.7/dist-packages/pycuda/compiler.pyc in compile(source, nvcc, options, keep, no_extern_c, arch, code, cache_dir, include_dirs, target)
    253         options.append("-I"+i)
    254 
--> 255     return compile_plain(source, options, keep, nvcc, cache_dir, target)
    256 
    257 

/usr/lib/python2.7/dist-packages/pycuda/compiler.pyc in compile_plain(source, options, keep, nvcc, cache_dir, target)
    135         raise CompileError("nvcc compilation of %s failed" % cu_file_path,
    136                 cmdline, stdout=stdout.decode("utf-8", "replace"),
--> 137                 stderr=stderr.decode("utf-8", "replace"))
    138 
    139     if stdout or stderr:

CompileError: nvcc compilation of /tmp/tmpVgfyrm/kernel.cu failed
[command: nvcc --cubin -arch sm_61 -I/usr/local/lib/python2.7/dist-packages/pycuda-2017.1.1-py2.7-linux-x86_64.egg/pycuda/cuda kernel.cu]
[stderr:
ERROR: No supported gcc/g++ host compiler found, but clang-3.8 is available.
       Use 'nvcc -ccbin clang-3.8' to use that instead.
]

有人知道如何将 -ccbin clang-3.8 添加到 pycuda 吗？

最佳答案

根据 documentation ，您可以通过两种方式为 nvcc 指定编译器选项

通过 PYCUDA_DEFAULT_NVCC_FLAGS 环境变量设置默认编译器选项。
通过使用 options= 关键字传递的列表设置给定 SourceModule 的编译器选项

关于python - Pycuda - 如何添加-ccbin clang-3.8，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49449355/

29

4

0

文章推荐： javascript - 如何加快meteor中的mongoDB查询响应时间？

文章推荐： jquery - TagIt 获取值(value)

文章推荐： python 字节到 C 数组(如 xxd 程序)

文章推荐： python - 重新排序并添加缺失的行

pycuda - 如何使用 pycuda 将二维数组输入内核？
我创建了一个形状为 (64, 128) 的 float32 numpy 数组，我想将它发送到 GPU。我怎么做？我的内核函数应该接受哪些参数？ float** myArray? 我试过直接将数组原样发
python - PyCuda:可以导入模块，然后我不能...(PyCUDA 示例)
示例代码: import pycuda.autoinit import pycuda.driver as drv import numpy from pycuda.compiler import So
python - pycuda.driver 中的 pycuda ImportError
我正在尝试编译一些源代码以使用我的 GPU。我为此使用pycuda。当我编译源代码时，我收到一些来自 Python 的错误: C:\Users\Dmitriy\wcm>python ws_gpu.py
python - 如何在 PyCUDA 中正确初始化 2D 表面？ (pycuda._driver.LogicError)
我正在尝试在 PyCUDA 中初始化 2D 表面并用 NumPy 2D 数组中的值填充它。据我所知，这个想法是打开drv.ArrayDescriptor, 使用这个描述符创建drv.Array，使
python - 带有 Flask 的 pyCUDA 给出 pycuda._driver.LogicError : cuModuleLoadDataEx
我想在 flask 服务器上运行 pyCUDA 代码。该文件直接使用python3正确运行，但使用flask调用相应函数时失败。相关代码如下: cudaFlask.py: import pycuda
cuda - pycuda 似乎是不确定的
我对 cuda 有一个奇怪的问题，在下面的片段中， #include #define OUTPUT_SIZE 26 typedef $PRECISION REAL; extern
python - pyCuda，发送多个单变量参数的问题
我在这里有一个 pycuda 程序，它从命令行读取图像并用反转的颜色保存一个版本: import pycuda.autoinit import pycuda.driver as device from
python - PyCUDA 使用字符串但不使用字符串数组
如何让 PyCuda 提取字符串数组而不是一个字符字符串？如果取消注释 C 代码中的该行，您将看到它迭代每个字符而不是每个字符串。现在我只是想计算每个字符串的长度，但最终会将其变成一个词频计数器
python - PyCUDA 正确使用结构
我正在尝试在 Pycuda 代码中实现一个结构，但出现越界错误。我尝试遵循 this教程，但我无法让它适用于我的情况。该问题很可能是由于指针使用不当造成的，例如该教程表明必须分配指针 memsize
python - Pycuda 编译错误
我在安装了 python 2.7(32 位)和安装了 cuda 7.5 whl 的 pycuda 的 Windows 机器上。我在运行示例程序来测试 pycuda 时出错。 Traceback (mo
python - pyCuda，发送多个单变量参数的问题
我这里有一个 pycuda 程序，它从命令行读取图像并保存颜色反转的版本: import pycuda.autoinit import pycuda.driver as device from pyc
python - PyCUDA 内核计时错误
足够简单 start=cuda.Event() func(args,block=blockdims) cuda.memcpy_dtoh(d,h) end=cuda.Event() dur=start.
python - PyCUDA；如何动态地将工作负载分配到多个设备
PyCUDA，尽管有其所有缺点，通常都会提供非常好的示例/可从 wiki 下载。但我在示例或文档(或粗略的谷歌搜索)中找不到任何内容来演示 PyCUDA 将工作负载动态分配到多个设备的方法。有人可以
python - Pycuda:多次调用内核的最佳方式
我正在使用 pycuda 制作相对论光线追踪器。基本上，对于大型 2D 数组中的每个“像素”，我们必须使用 Runge Kutta 求解 6 个 ODE 系统。由于每个集成都独立于其余集成，因此应该非
python - PyCUDA 核函数
我是 PyCUDA 的新手，正在浏览 PyCUDA 网站上的一些示例。我正在尝试弄清楚某些代码行背后的逻辑，如果有人解释了它背后的想法，我将不胜感激。以下代码片段来自 PyCUDA 网站。函数定义里
python - PyCUDA 按值将变量传递给内核
应该足够简单；我确实想将一个 int 发送到 SourceModule 内核声明，其中 C 函数 __global__......(int value,.....) 随着值的声明和调用... valu
python - PyCuda mem_alloc 初始化错误
in desaturate_image redarray_gpu = cuda.mem_alloc(self.redarray.nbytes) pycuda._driver.LogicErro
cuda - 在 PyCUDA 中打印消息
在简单的 CUDA 程序中，我们可以通过包含 cuPrintf.h 来按线程打印消息，但在 PyCUDA 中执行此操作在任何地方都没有解释。如何在 PyCUDA 中做到这一点？最佳答案在 Comp
cuda - 如何在 pyCUDA 内核中生成随机数？
我正在使用 pyCUDA 进行 CUDA 编程。我需要在内核函数中使用随机数。 CURAND 库在其中不起作用(pyCUDA)。由于GPU有很多工作要做，在CPU内部生成随机数然后将它们传输到GPU是
python - 将复数数组传递到 PyCUDA 内核
我正在尝试将二维复数数组传递到 PyCUDA 内核中，但得到了意想不到的结果。这是我的测试代码: import numpy as np import pycuda.driver as cuda im

首页

博学

6Ren·AI

商城

python - Pycuda - 如何添加-ccbin clang-3.8