gpt4 book ai didi

docker - Tensorflow/Nvidia/CUDA docker不匹配的版本

转载 作者:行者123 更新时间:2023-12-02 18:20:05 27 4
gpt4 key购买 nike

我正在尝试将tensorflow和nvidia与docker结合使用,但遇到以下错误:

docker run --runtime=nvidia -it --rm tensorflow/tensorflow:latest-gpu python -c "import tensorflow as tf; tf.enable_eager_execution(); print(tf.reduce_sum(tf.random_normal([1000, 1000])))"

docker: Error response from daemon: OCI runtime create failed: container_linux.go:344: starting container process caused "process_linux.go:424: container init caused \"process_linux.go:407: running prestart hook 1 caused \\"error running hook: exit status 1, stdout: , stderr: exec command: [/usr/bin/nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device=all --compute --utility --require=cuda>=10.0 brand=tesla,driver>=384,driver<385 --pid=5393 /var/lib/docker/overlay2/......./merged]\\nnvidia-container-cli: requirement error: unsatisfied condition: brand = tesla\\n\\"\"": unknown.



尝试运行nvidia-smi时出现类似错误:

docker run --runtime=nvidia --rm nvidia/cuda nvidia-smi



但是,当尝试使用cuda:9.0-base运行nvidia-smi时,它的工作原理就像一个魅力:

docker run --runtime=nvidia --rm nvidia/cuda:9.0-base nvidia-smi



我需要确保cuda 10正常工作还是可以使用cuda 9运行tensorflow?我如何使用cuda:9.0-base运行tensorflow的docker镜像? (仍然是docker newby)。

非常感谢!

最佳答案

好的,我认为我终于开始弄清楚机器上的混乱情况。

tensorflow镜像并不关心cuda镜像的版本,它不使用docker cuda镜像。它关心我的nvidia驱动程序,因为它在tensorflow图像中集成了CUDA。

(正在使用当前驱动程序的docker cuda镜像是cuda:9.0)

这意味着我必须找到与我的驱动程序配合使用的tensorflow镜像(390.116),或更新驱动程序。

我用tensorflow:1.12.0-gpu-py3尝试了相同的命令,它没有任何问题。

关于docker - Tensorflow/Nvidia/CUDA docker不匹配的版本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55389669/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com