gpt4 book ai didi

c++ - 调试 "Invalid address space"错误

转载 作者:行者123 更新时间:2023-11-30 05:09:38 25 4
gpt4 key购买 nike

我构建了一些使用 OpenACC 的 C++ 代码,并使用 PGI 编译器对其进行了编译,以便在 Tesla GPU 上使用。

编译成功,没有任何警告。

我运行程序并得到两个错误:

call to cuStreamSynchronize returned error 717: Invalid address space
call to cuMemFreeHost returned error 717: Invalid address space

除了建议 enabling unified memory 之外,互联网似乎对此知之甚少。这样问题就自动被掩盖了。我不喜欢那种解决方案。

我该如何调试它?

对于仅在 CPU 上运行的 C++ 代码,我会启动 gdb,进行回溯,然后说“啊哈!”

但现在我的代码存在于 CPU GPU 上,数据在两者之间流动。我什至不知道该使用什么工具。

后备方案是开始注释行,直到问题消失,但这似乎也不是最佳选择。

最佳答案

您可以使用“cuda-gdb”调试设备代码或使用“cuda-memcheck”检查内存错误。

虽然我不确定两者是否对这里有帮助。该错误表明设备代码正在使用来自错误内存空间的地址发出指令。例如,将共享内存指针与需要全局内存指针的指令一起使用。

我以前没有见过这个错误,也没有看到任何以前的错误报告,所以只能推测原因。一种可能性是,如果您有一个共享内存变量(“private”子句中的标量或数组,或“缓存”指令)从外部 gang 循环传递到 vector 例程。在这种情况下, vector 例程可能正在访问变量,就好像它在全局内存中一样。

无论是什么原因,很可能是编译器错误。如果可能,请张贴或发送给 PGI 客户服务 (trs@pgroup.com) 一个重现示例,我会把它交给我们的编译器工程师进行调查。

一旦我更好地了解原因,我也可以尝试为您提供解决方法。不过与此同时,您可以尝试使用“-ta=tesla:nollvm,keepgpu”进行编译。 “nollvm”将导致编译器生成 OpenACC 内核的中间 CUDA C 版本,而不是默认的 LLVM 设备代码生成器。 “keepgpu”将保留您可以检查的中间“.gpu”文件。

关于c++ - 调试 "Invalid address space"错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46083799/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com