c++ - 如何解决 Paddle v0.8.0b 上的 "cudaSuccess = err (0 vs. 8)"错误？-6ren

c++ - 如何解决 Paddle v0.8.0b 上的 "cudaSuccess = err (0 vs. 8)"错误？

转载作者：行者123 更新时间：2023-11-28 02:00:22

我已经安装了paddlepaddle使用来自 https://github.com/baidu/Paddle/releases/download/V0.8.0b1/paddle-gpu-0.8.0b1-Linux.deb 的 .deb 文件

我在配备 4 GTX 1080 的机器上安装了 CUDA 8.0 和 cudnn v5.1，但没有 NVIDIA 加速图形驱动程序:

$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Sun_Sep__4_22:14:01_CDT_2016
Cuda compilation tools, release 8.0, V8.0.44

我已经设置了 shell 变量:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64:/usr/local/cuda/extras/CUPTI/lib64"
export CUDA_HOME=/usr/local/cuda

所有 cuda 都工作正常，因为我已经运行了所有 NVIDIA_CUDA-8.0_Samples 并且它们“通过”了所有测试。

Paddle/demo/quick_start 中的quick_start 演示代码也运行流畅，没有抛出错误。

但是，当我尝试从 Paddle github 存储库运行 image_classification 演示时，我收到了一个无效设备功能错误。有什么办法可以解决这个问题吗？

hl_gpu_matrix_kernel.cuh:181] Check failed: cudaSuccess == err (0 vs. 8) [hl_gpu_apply_unary_op failed] CUDA error: invalid device function

完整的追溯:

~/Paddle/demo/image_classification$ bash train.sh 
I1005 14:34:51.929863 10461 Util.cpp:151] commandline: /home/ltan/Paddle/binary/bin/../opt/paddle/bin/paddle_trainer --config=vgg_16_cifar.py --dot_period=10 --log_period=100 --test_all_data_in_one_period=1 --use_gpu=1 --trainer_count=1 --num_passes=200 --save_dir=./cifar_vgg_model 
I1005 14:34:56.705898 10461 Util.cpp:126] Calling runInitFunctions
I1005 14:34:56.706171 10461 Util.cpp:139] Call runInitFunctions done.
[INFO 2016-10-05 14:34:56,918 layers.py:1620] channels=3 size=3072
[INFO 2016-10-05 14:34:56,919 layers.py:1620] output size for __conv_0__ is 32 
[INFO 2016-10-05 14:34:56,920 layers.py:1620] channels=64 size=65536
[INFO 2016-10-05 14:34:56,920 layers.py:1620] output size for __conv_1__ is 32 
[INFO 2016-10-05 14:34:56,922 layers.py:1681] output size for __pool_0__ is 16*16 
[INFO 2016-10-05 14:34:56,923 layers.py:1620] channels=64 size=16384
[INFO 2016-10-05 14:34:56,923 layers.py:1620] output size for __conv_2__ is 16 
[INFO 2016-10-05 14:34:56,924 layers.py:1620] channels=128 size=32768
[INFO 2016-10-05 14:34:56,925 layers.py:1620] output size for __conv_3__ is 16 
[INFO 2016-10-05 14:34:56,926 layers.py:1681] output size for __pool_1__ is 8*8 
[INFO 2016-10-05 14:34:56,927 layers.py:1620] channels=128 size=8192
[INFO 2016-10-05 14:34:56,927 layers.py:1620] output size for __conv_4__ is 8 
[INFO 2016-10-05 14:34:56,928 layers.py:1620] channels=256 size=16384
[INFO 2016-10-05 14:34:56,929 layers.py:1620] output size for __conv_5__ is 8 
[INFO 2016-10-05 14:34:56,930 layers.py:1620] channels=256 size=16384
[INFO 2016-10-05 14:34:56,930 layers.py:1620] output size for __conv_6__ is 8 
[INFO 2016-10-05 14:34:56,932 layers.py:1681] output size for __pool_2__ is 4*4 
[INFO 2016-10-05 14:34:56,932 layers.py:1620] channels=256 size=4096
[INFO 2016-10-05 14:34:56,933 layers.py:1620] output size for __conv_7__ is 4 
[INFO 2016-10-05 14:34:56,934 layers.py:1620] channels=512 size=8192
[INFO 2016-10-05 14:34:56,934 layers.py:1620] output size for __conv_8__ is 4 
[INFO 2016-10-05 14:34:56,936 layers.py:1620] channels=512 size=8192
[INFO 2016-10-05 14:34:56,936 layers.py:1620] output size for __conv_9__ is 4 
[INFO 2016-10-05 14:34:56,938 layers.py:1681] output size for __pool_3__ is 2*2 
[INFO 2016-10-05 14:34:56,938 layers.py:1681] output size for __pool_4__ is 1*1 
[INFO 2016-10-05 14:34:56,941 networks.py:1125] The input order is [image, label]
[INFO 2016-10-05 14:34:56,941 networks.py:1132] The output order is [__cost_0__]
I1005 14:34:56.948256 10461 Trainer.cpp:170] trainer mode: Normal
F1005 14:34:56.949136 10461 hl_gpu_matrix_kernel.cuh:181] Check failed: cudaSuccess == err (0 vs. 8) [hl_gpu_apply_unary_op failed] CUDA error: invalid device function
*** Check failure stack trace: ***
    @     0x7fa557316daa  (unknown)
    @     0x7fa557316ce4  (unknown)
    @     0x7fa5573166e6  (unknown)
    @     0x7fa557319687  (unknown)
    @           0x78a939  hl_gpu_apply_unary_op<>()
    @           0x7536bf  paddle::BaseMatrixT<>::applyUnary<>()
    @           0x7532a9  paddle::BaseMatrixT<>::applyUnary<>()
    @           0x73d82f  paddle::BaseMatrixT<>::zero()
    @           0x66d2ae  paddle::Parameter::enableType()
    @           0x669acc  paddle::parameterInitNN()
    @           0x66bd13  paddle::NeuralNetwork::init()
    @           0x679ed3  paddle::GradientMachine::create()
    @           0x6a6355  paddle::TrainerInternal::init()
    @           0x6a2697  paddle::Trainer::init()
    @           0x53a1f5  main
    @     0x7fa556522f45  (unknown)
    @           0x545ae5  (unknown)
    @              (nil)  (unknown)
/home/xxx/Paddle/binary/bin/paddle: line 81: 10461 Aborted                 (core dumped) ${DEBUGGER} $MYDIR/../opt/paddle/bin/paddle_trainer ${@:2}
No data to plot. Exiting!

根据 git repo 的#158 问题，这个问题应该在#170 中得到解决，并且支持 GTX 1080 和 CUDA 8.0，但是在访问 GPU 功能时仍然会抛出错误。 (抱歉不能添加超过 2 个信誉低的链接)

有谁知道如何解决这个问题并安装它以便 image_classification 可以运行？

我也尝试过从源代码编译+安装，当 quick_start 演示顺利运行时，出现了同样的错误。

最佳答案

问题是因为在 CUDA 8.0 的 Paddle/cmake/flags.cmake 中为架构设置了标志。

已在https://github.com/baidu/Paddle/pull/165/files中解决通过添加 compute_52、sm_52 和 compute_60 和 sm_60

关于c++ - 如何解决 Paddle v0.8.0b 上的 "cudaSuccess = err (0 vs. 8)"错误？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39850309/

文章推荐： html - CSS关于纯css的折叠菜单

文章推荐： javascript - HTML5 Canvas 软笔刷

文章推荐： c++ - 访问类私有(private)成员中的结构成员？

java - 小程序 "pong"游戏 : ball goes right through paddle if paddle is moving towards the ball
通常此类游戏中只有 Y 轴移动可用，但我决定以同样允许 X 轴桨移动的方式进行制作。如果我在球击中桨时不在 X 轴上移动桨(在这种情况下它会直接穿过)，则游戏工作得很好。如果我在球击中桨之前停止 X
paddle 12种学习率调度器
文本框检测的Cosine学习率调度器： 13种调度器文本框检测的Cosine学习率调度器：学习率 0.001 效果好像比较好，推荐使用 configs/det/ch_ppocr_v2.0/ch_d
xna - Breakout Paddle 碰撞角
我正在制作 Breakout 克隆游戏，但在 Racket 碰撞方面遇到了一些麻烦。我有一个矩形代表球和桨，当它们相交时，代表球速度的 Y 向量被取反(如下所示)。一切正常。问题是当桨向右移动时，我希
c# - Pong Paddle 碰撞速度和回弹角度
好吧，我为此搜索了很多，但我能找到的只是人们说的像 pi * direction，方向是我假设的球进入的角度。但我的问题是，我不知道我是如何得到球进入的角度的，所以我做不到这些。如果有人可以解释我将如
next.js - Paddle - 结帐 ID 必须是有效的结帐 ID
我正在尝试在本地主机上测试 paddle 订阅。当我使用示例 git repo 中的产品 ID 和供应商 ID 时，一切正常。当我使用自己的供应商 ID 和产品 ID(计划 ID)时，出现 400
java - 将 MouseMotionListener 添加到 paddle(Java Pong 游戏)
我搜索了整个网络试图找到解决方案，但最终我只是变得更加困惑和沮丧。我正在尝试让我的桨移动(paddle_y)。 Paddle 不需要 x 坐标，只需在垂直线上上下移动即可。我不知道 mouseList
Swift Pong(无 SpriteKit): Detect side of paddle that the ball hit
目前，我正在用 Swift(没有 SpriteKit)制作一个只有一个玩家的乒乓球游戏:球可以从视野的各个方向反弹。经过一些研究，我使用这个算法来检测碰撞: if (rect1.x rect2.x
c++ - 如何解决 Paddle v0.8.0b 上的 "cudaSuccess = err (0 vs. 8)"错误？
我已经安装了paddlepaddle使用来自 https://github.com/baidu/Paddle/releases/download/V0.8.0b1/paddle-gpu-0.8.0b1

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

c++ - 如何解决 Paddle v0.8.0b 上的 "cudaSuccess = err (0 vs. 8)"错误？