- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
关闭。这个问题需要details or clarity .它目前不接受答案。
想改善这个问题吗?通过 editing this post 添加详细信息并澄清问题.
7 个月前关闭。
Improve this question
我使用了一个程序来绘制曼德布罗图,并使用 njit 让它在 CPU 线程上运行。现在我想生成一个 32k 的图像,但即使是整个线程也太慢了。所以我试图让代码在 GPU 上运行。这是代码:
from numba import njit, cuda, vectorize
from PIL import Image, ImageDraw
@vectorize(['complex128(complex128)'], target='cuda')
def mandelbrot(c):
z = 0
n = 0
while abs(z) <= 2 and n < 80:
z = z*z + c
n += 1
return n
def vari(WIDTH, HEIGHT, RE_START, RE_END, IM_START, IM_END, draw):
for x in range(0, WIDTH):
for y in range(0, HEIGHT):
print(x)
# Convert pixel coordinate to complex number
c = complex(RE_START + (x / WIDTH) * (RE_END - RE_START),
IM_START + (y / HEIGHT) * (IM_END - IM_START))
# Compute the number of iterations
m = mandelbrot(c)
# The color depends on the number of iterations
color = 255 - int(m * 255 / 80)
# Plot the point
draw.point([x, y], (color, color, color))
def vai():
# Image size (pixels)
WIDTH = 15360
HEIGHT = 8640
# Plot window
RE_START = -2
RE_END = 1
IM_START = -1
IM_END = 1
palette = []
im = Image.new('RGB', (WIDTH, HEIGHT), (0, 0, 0))
draw = ImageDraw.Draw(im)
vari(WIDTH, HEIGHT, RE_START, RE_END, IM_START, IM_END, draw )
im.save('output.png', 'PNG')
vai()
这是错误:
D:\anaconda\python.exe C:/Users/techguy/PycharmProjects/mandelbrot/main.py
0
Traceback (most recent call last):
File "C:/Users/techguy/PycharmProjects/mandelbrot/main.py", line 56, in <module>
vai()
File "C:/Users/techguy/PycharmProjects/mandelbrot/main.py", line 52, in vai
vari(WIDTH, HEIGHT, RE_START, RE_END, IM_START, IM_END, draw )
File "C:/Users/techguy/PycharmProjects/mandelbrot/main.py", line 30, in vari
m = mandelbrot(c)
File "D:\anaconda\lib\site-packages\numba\cuda\dispatcher.py", line 41, in __call__
return CUDAUFuncMechanism.call(self.functions, args, kws)
File "D:\anaconda\lib\site-packages\numba\np\ufunc\deviceufunc.py", line 301, in call
cr.launch(func, shape[0], stream, devarys)
File "D:\anaconda\lib\site-packages\numba\cuda\dispatcher.py", line 152, in launch
func.forall(count, stream=stream)(*args)
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 372, in __call__
kernel = self.kernel.specialize(*args)
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 881, in specialize
specialization = Dispatcher(self.py_func, [types.void(*argtypes)],
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 808, in __init__
self.compile(sigs[0])
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 935, in compile
kernel.bind()
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 576, in bind
self._func.get()
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 446, in get
ptx = self.ptx.get()
File "D:\anaconda\lib\site-packages\numba\cuda\compiler.py", line 414, in get
arch = nvvm.get_arch_option(*cc)
File "D:\anaconda\lib\site-packages\numba\cuda\cudadrv\nvvm.py", line 345, in get_arch_option
return 'compute_%d%d' % arch
TypeError: not enough arguments for format string
Process finished with exit code 1
如果我替换
@vectorize
与
@njit(nogil=true)
它工作正常,但它在 CPU 上运行。我绝对需要它在 GPU 上运行。我认为问题类似于复杂类型。
from numba import cuda, vectorize
@vectorize(['int32(complex128)'], target='cuda')
def mandelbrot(c):
z = 0
n = 0
while abs(z) <= 2 and n < 80:
z = z*z + c
n += 1
return n
comple = complex(10, 12)
print(mandelbrot(comple))
最佳答案
您表现出对 vectorize 的功能缺乏非常基本的了解,更不用说 cuda。在你看这个答案之前,你应该在这里阅读:https://numba.pydata.org/numba-doc/dev/user/vectorize.html
您似乎缺少基本信息,例如,numba 上下文之外的矢量化通常意味着什么? Vector 意味着我们正在运行一个 SIMD对某个数组的操作又名 矢量输入。看看你的代码:
@vectorize(['complex128(complex128)'], target='cuda')
def mandelbrot(c):
z = 0
n = 0
while abs(z) <= 2 and n < 80:
z = z*z + c
n += 1
return n
当您添加该装饰器时,您将此函数转换为矢量化版本。没有装饰器,它需要一个标量值,即单个复数值。当您转换它时,mandebrot 将需要一个值向量,以便每个值都可以*并行运行。那么你能发现你刚刚在这里创建的函数的大量滥用吗?
def vari(WIDTH, HEIGHT, RE_START, RE_END, IM_START, IM_END, draw):
for x in range(0, WIDTH):
for y in range(0, HEIGHT):
print(x)
# Convert pixel coordinate to complex number
c = complex(RE_START + (x / WIDTH) * (RE_END - RE_START),
IM_START + (y / HEIGHT) * (IM_END - IM_START))
# Compute the number of iterations
m = mandelbrot(c)
# The color depends on the number of iterations
color = 255 - int(m * 255 / 80)
# Plot the point
draw.point([x, y], (color, color, color))
您的 mandelbrot 函数正在循环中对标量值进行运算。换句话说,您以最糟糕的方式错误地使用了矢量化函数。看看这个转换后的代码:
def vari(WIDTH, HEIGHT, RE_START, RE_END, IM_START, IM_END, draw):
complex_mat = np.empty((HEIGHT, WIDTH), dtype=np.complex128)
for x in range(0, WIDTH):
for y in range(0, HEIGHT):
print(x)
# Convert pixel coordinate to complex number
c = complex(RE_START + (x / WIDTH) * (RE_END - RE_START),
IM_START + (y / HEIGHT) * (IM_END - IM_START))
complex_mat[y,x] = c
# Compute the number of iterations
m = mandelbrot(complex_mat)
for x in range(0, WIDTH):
for y in range(0, HEIGHT):
# The color depends on the number of iterations
color = 255 - int(m[y,x] * 255 / 80)
# Plot the point
draw.point([x, y], (color, color, color))
我们首先创建要输入到“向量化函数”中的“向量”,在这种情况下,任何 numpy 数组都应该做,它只会以相同的形状输出按元素应用。
File "D:\anaconda\lib\site-packages\numba\cuda\cudadrv\nvvm.py", line 345, in get_arch_option
return 'compute_%d%d' % arch
TypeError: not enough arguments for format string
错误。如果您在运行我修改后的版本时仍然出现此错误,那么您还有一些其他配置错误,由于缺乏研究,该错误太广泛且超出了本问题的范围,例如,它可能与“did您安装了 cuda”,但如果没有更集中的问题,我们就无法知道。这是我生成的输出(更小,以便它符合 SO 的大小要求)。注意我没有更换
@vectorize(['complex128(complex128)'], target='cuda')
和
@vectorize(['int32(complex128)'], target='cuda')
这不是您问题的适当解决方案。这再次指向一些用户特定的配置错误。
关于cuda - cuda 的向量化,一个以复数作为输入,一个复数作为输出的函数在 numba 中失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66337136/
C语言sscanf()函数:从字符串中读取指定格式的数据 头文件: ?
最近,我有一个关于工作预评估的问题,即使查询了每个功能的工作原理,我也不知道如何解决。这是一个伪代码。 下面是一个名为foo()的函数,该函数将被传递一个值并返回一个值。如果将以下值传递给foo函数,
CStr 函数 返回表达式,该表达式已被转换为 String 子类型的 Variant。 CStr(expression) expression 参数是任意有效的表达式。 说明 通常,可以
CSng 函数 返回表达式,该表达式已被转换为 Single 子类型的 Variant。 CSng(expression) expression 参数是任意有效的表达式。 说明 通常,可
CreateObject 函数 创建并返回对 Automation 对象的引用。 CreateObject(servername.typename [, location]) 参数 serv
Cos 函数 返回某个角的余弦值。 Cos(number) number 参数可以是任何将某个角表示为弧度的有效数值表达式。 说明 Cos 函数取某个角并返回直角三角形两边的比值。此比值是
CLng 函数 返回表达式,此表达式已被转换为 Long 子类型的 Variant。 CLng(expression) expression 参数是任意有效的表达式。 说明 通常,您可以使
CInt 函数 返回表达式,此表达式已被转换为 Integer 子类型的 Variant。 CInt(expression) expression 参数是任意有效的表达式。 说明 通常,可
Chr 函数 返回与指定的 ANSI 字符代码相对应的字符。 Chr(charcode) charcode 参数是可以标识字符的数字。 说明 从 0 到 31 的数字表示标准的不可打印的
CDbl 函数 返回表达式,此表达式已被转换为 Double 子类型的 Variant。 CDbl(expression) expression 参数是任意有效的表达式。 说明 通常,您可
CDate 函数 返回表达式,此表达式已被转换为 Date 子类型的 Variant。 CDate(date) date 参数是任意有效的日期表达式。 说明 IsDate 函数用于判断 d
CCur 函数 返回表达式,此表达式已被转换为 Currency 子类型的 Variant。 CCur(expression) expression 参数是任意有效的表达式。 说明 通常,
CByte 函数 返回表达式,此表达式已被转换为 Byte 子类型的 Variant。 CByte(expression) expression 参数是任意有效的表达式。 说明 通常,可以
CBool 函数 返回表达式,此表达式已转换为 Boolean 子类型的 Variant。 CBool(expression) expression 是任意有效的表达式。 说明 如果 ex
Atn 函数 返回数值的反正切值。 Atn(number) number 参数可以是任意有效的数值表达式。 说明 Atn 函数计算直角三角形两个边的比值 (number) 并返回对应角的弧
Asc 函数 返回与字符串的第一个字母对应的 ANSI 字符代码。 Asc(string) string 参数是任意有效的字符串表达式。如果 string 参数未包含字符,则将发生运行时错误。
Array 函数 返回包含数组的 Variant。 Array(arglist) arglist 参数是赋给包含在 Variant 中的数组元素的值的列表(用逗号分隔)。如果没有指定此参数,则
Abs 函数 返回数字的绝对值。 Abs(number) number 参数可以是任意有效的数值表达式。如果 number 包含 Null,则返回 Null;如果是未初始化变量,则返回 0。
FormatPercent 函数 返回表达式,此表达式已被格式化为尾随有 % 符号的百分比(乘以 100 )。 FormatPercent(expression[,NumDigitsAfterD
FormatNumber 函数 返回表达式,此表达式已被格式化为数值。 FormatNumber( expression [,NumDigitsAfterDecimal [,Inc
我是一名优秀的程序员,十分优秀!