gpt4 book ai didi

python - CUDA 问题 - 如何在 Win 10 中清理安装 CUDA 以解决 cudaGetDevice() 失败

转载 作者:行者123 更新时间:2023-12-03 11:07:07 31 4
gpt4 key购买 nike

我之前在这个 Win 10 64 位家庭系统(针对 1080Ti 卡)上运行过 CUDA 9.x,但需要更新到 TensorFlow 2 的 CUDA 10.0。我最初认为 TF2 可以与 CUDA 10.1 一起使用,所以首先安装了 10.1 和后来才发现一定是CUDA 10。

无法让它工作...

为了测试 TF,我运行它来验证安装(通过 Anaconda 的 Jupyter notebook - 新构建的 TF2 环境)

import tensforflow as tf
print(tf.reduce_sum(tf.random.normal([1000, 1000])))

我在基本 Python 测试中收到此错误

InternalError: cudaGetDevice() failed. Status: cudaGetErrorString symbol not found



这表明找不到 key 文件,但我无法找出根本原因 - 并且该错误信息的点击率很少,但没有一个对我有帮助。

当前配置

已安装 CUDA 10.0
Nvidia 驱动程序 436.48 游戏就绪驱动程序

迄今为止的潜在问题和解决措施

显然他们都没有固定的东西
  • 旧的 CUDA 安装 - 9.0、9.1、10.0、10.1:除 10.0 之外的所有安装都已卸载并重新启动 PC; 10.0 安装程序然后再次运行
  • 更新 cudnn 文件:首先尝试使用原件,然后将 cudnn 文件 v7.6.3.30 复制到 bin、include、lib 中
  • 从游戏就绪驱动程序切换到“Studio”驱动程序
  • 检查所有环境变量 - 删除所有引用 CUDA 的内容!= 10.0
  • 更新 在 system32 中将 nvcuda.dll 重命名为 .old 并重新运行 CUDA 10.0 安装程序......没有生成新的 nvcuda。
  • 更新 2 我在驱动程序库中找到了 nvcuda64.dll v 10.0.132,并用它替换了 system32 中的 nvcuda.dll;重启后,nvidia-smi 现在根本没有报告 CUDA 版本:(

  • 已知奇数
  • [被更新 2 取代] nvidia-smi.exe 报告 CUDA 10.1(是的,它在我的 Win 10 上可用)-但是通过注册表检查我找不到任何表明 CUDA 10.1 仍在那里徘徊的信息... 更新 在 C:\Windows\System32
  • 中找到它
  • 尽管卸载了,我仍然在注册表中的 Computer\HKEY_USERS.DEFAULT\Software\Microsoft\VisualStudio\14.0_Config\InstalledProducts 键下有 CudaXYZWizardsPackage,XYZ = 90, 91, 100, 101 - 但我怀疑这是 TF 的问题Python ;) 更新 除了 10.0 之外,C:\Program Files (x86)\Microsoft Visual Studio\2017\Community\Common7\IDE\Extensions\NVIDIA 中没有任何内容,因此只是孤立的 reg 条目。

  • 其他信息
  • 在执行所有卸载等操作之前,我确实在 VS 2017 中成功构建并运行了 Nvidia 示例时钟项目,因此基础知识还可以(当时)

  • 问题
  • 如何完全删除所有 CUDA 痕迹以从头开始?
  • 我将来如何诊断此类问题以找出问题所在/该怎么做
  • 能否更简单地解决这个特定问题?
  • (New) 我在哪里可以得到 nvcuda.dll 10.0 在 system32 中替换? - 答案 一种可能性是来自 C:\Windows\System32\DriverStore\FileRepository
  • 最佳答案

  • 下载并安装 Anaconda (Python 3.7):https://www.anaconda.com/distribution/
  • 在命令提示符中:
  • conda update condaconda update pythonconda create --name tensorflow-gpuconda activate tensorflow-gpuconda install pip jupyterpip install tensorflow-gpuconda install cudatoolkit=10.0 -c pytorch
    1. in Start menu select Anaconda3 (64-bit) -> Jupyter Notebook (tensorflow-gpu)
    import tensorflow as tf
    %%time
    with tf.device('/CPU:0'):
    a = tf.random.uniform([1000,1000])
    b = tf.random.uniform([1000,1000])
    c = tf.matmul(a, b)

    Wall time: 18.9 ms


    %%time
    with tf.device('/GPU:0'):
    a = tf.random.uniform([1000,1000])
    b = tf.random.uniform([1000,1000])
    c = tf.matmul(a, b)

    Wall time: 2.99 ms

    关于python - CUDA 问题 - 如何在 Win 10 中清理安装 CUDA 以解决 cudaGetDevice() 失败,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58235018/

    31 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com