Tensorflow 2.1 获取卷积算法失败。这可能是因为 cuDNN 初始化失败-6ren

Tensorflow 2.1 获取卷积算法失败。这可能是因为 cuDNN 初始化失败

转载作者：行者123 更新时间：2023-12-01 21:47:29

24

4

我正在将 anaconda python 3.7 和 tensorflow 2.1 与 cuda 10.1 和 cudnn 7.6.5 一起使用，并尝试运行 retinaset ( https://github.com/fizyr/keras-retinanet ):

python keras_retinanet/bin/train.py --freeze-backbone --random-transform --batch-size 8 --steps 500 --epochs 10 csv annotations.csv classes.csv

下面是由此产生的错误:

Epoch 1/10
2020-02-10 20:34:37.807590: I tensorflow/stream_executor/platform/default/dso_loader.cc:44] Successfully opened dynamic library cudnn64_7.dll
2020-02-10 20:34:38.835777: E tensorflow/stream_executor/cuda/cuda_dnn.cc:329] Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
2020-02-10 20:34:39.753051: E tensorflow/stream_executor/cuda/cuda_dnn.cc:329] Could not create cudnn handle: CUDNN_STATUS_INTERNAL_ERROR
2020-02-10 20:34:39.776706: W tensorflow/core/common_runtime/base_collective_executor.cc:217] BaseCollectiveExecutor::StartAbort Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
         [[{{node conv1/convolution}}]]
Traceback (most recent call last):
  File "keras_retinanet/bin/train.py", line 530, in <module>
    main()
  File "keras_retinanet/bin/train.py", line 525, in main
    initial_epoch=args.initial_epoch
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\keras\legacy\interfaces.py", line 91, in wrapper
    return func(*args, **kwargs)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\keras\engine\training.py", line 1732, in fit_generator
    initial_epoch=initial_epoch)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\keras\engine\training_generator.py", line 220, in fit_generator
    reset_metrics=False)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\keras\engine\training.py", line 1514, in train_on_batch
    outputs = self.train_function(ins)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\tensorflow_core\python\keras\backend.py", line 3727, in __call__
    outputs = self._graph_fn(*converted_inputs)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\tensorflow_core\python\eager\function.py", line 1551, in __call__
    return self._call_impl(args, kwargs)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\tensorflow_core\python\eager\function.py", line 1591, in _call_impl
    return self._call_flat(args, self.captured_inputs, cancellation_manager)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\tensorflow_core\python\eager\function.py", line 1692, in _call_flat
    ctx, args, cancellation_manager=cancellation_manager))
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\tensorflow_core\python\eager\function.py", line 545, in call
    ctx=ctx)
  File "C:\Anaconda\Anaconda3.7\lib\site-packages\tensorflow_core\python\eager\execute.py", line 67, in quick_execute
    six.raise_from(core._status_to_exception(e.code, message), None)
  File "<string>", line 3, in raise_from
tensorflow.python.framework.errors_impl.UnknownError:  Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
         [[node conv1/convolution (defined at C:\Anaconda\Anaconda3.7\lib\site-packages\keras\backend\tensorflow_backend.py:3009) ]] [Op:__inference_keras_scratch_graph_12376]

Function call stack:
keras_scratch_graph

有人遇到过类似的问题吗？

最佳答案

尝试使用 tf.distribute.MirroredStrategy() 在两个 GPU 上训练我的 CNN 模型时，我遇到了同样的错误。我现在找到了一个解决方法，允许我同时使用它们(尽管在单个 GPU 上训练效果很好)。尝试将以下内容放在应用程序的开头:

config = tf.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
session =tf.compat.v1.InteractiveSession(config=config)

希望对您有所帮助!

关于Tensorflow 2.1 获取卷积算法失败。这可能是因为 cuDNN 初始化失败，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60160874/

24

4

0

文章推荐： html - 仅使用 CSS 使第一列在 react 表中变粘

文章推荐： java - 从一个类到另一个类使用 JTextField

文章推荐： java - 我怎样才能不将纹理应用到模型的一部分？

c++ - 使用 TextPad/G++ 链接和编译 C++ 文件时出错，可能(可能)只是语法？
这很可能是我的语法错误，因为我对在 C++ 中使用多个文件和结构(特别是将结构传递给函数)还很陌生。这是三个文件: 主要.cpp: #include #include #include #inc
typescript - 类验证器的高级条件(可能)？
我有 TypeScript NestJS 项目。我需要验证传入的 DTO 到我的 API。它可以被描述为“创建项目”，其中我们有建筑类型(房屋、公寓、花园)，并根据该类型我们需要定义: 房屋:楼层包
c# - 排除通用约束中的类型(可能？)
是否可以从可用于泛型参数的可能类型集中排除特定类型？如果是如何。例如 Foo() : where T != bool 将意味着除了类型 bool 之外的任何类型。编辑为什么？以下代码是我尝试强
javascript - 纹理未生成有效(可能)
我的 WebGL 体积光线转换应用程序即将完成。但是我发现了一个问题。我必须通过 2D 纹理模拟 3D 纹理。这不是问题。我正在用小切片创建一个巨大的纹理。巨大纹理的尺寸约为 4096x4096 像素
javascript - 返回顶部按钮问题(可能)？
我正在处理的网页上显示了一个返回顶部按钮。当您向下滚动时，有时单击它时，它会跳到顶部，然后跳回您在页面上的位置，然后像预期的那样平滑滚动到顶部。请记住，它并不总是这样做。这只是一个滞后或故障问题还是我
C#(可能)使用泛型
我对此还很陌生，所以请耐心等待。我有一个类，它具有三个属性:几个整数和一个用户定义对象的集合。 public class Response { public int num1 { get;
java - (可能)非常简单的Java多线程问题
我正在制作一款平台游戏，让玩家每 30 毫秒跳跃一次，并向上添加少量的力。我想我应该使用多线程，因为我之前已经做过一些，而且看起来很简单。无论如何，我尝试了这个: public void jump()
c# - 排除通用约束中的类型(可能？)
是否可以从可能的类型集中排除特定类型，这些类型可以在泛型参数中使用？如果是这样的话。例如 Foo() : where T != bool 表示除 bool 类型之外的任何类型。编辑为什么？以下
mysql - 查询中内部和外部连接在一起，可能
我正在尝试在单个查询中实现内部和外部联接，我不确定我的做法是正确还是错误，因为我不太擅长查询。就这样吧。我有以下表格。 hrs_residentials hrs_residential_utili
javascript - 冲突的脚本......可能
关于 my website ，有一段代码可以向页面添加几个元素。这段代码不是我可以编辑的东西，而且我对它放置这些元素的位置不满意，因为它弄乱了我的一些布局。所以我想出了一个小的 jQuery 来将它们
Postgresql:以下选择是否合理/可能？
一位客户希望我创建一个数据集，如下所示。我不知道这是否可能或合乎逻辑。我有表parent: id name ------- ------- 1 parent1 2
javascript - 检测其他打开的网站甚至应用程序的数量(可能)？
这可能吗？google 好像没有这方面的资料.. 这样，如果用户在另一个网站上播放视频或歌曲，我的音量就会自动减小最佳答案不，这是不可能的。如果可能的话，它必须是特定于浏览器的，但我不认为这种情
javascript - 响应式设计而不是此示例的自适应设计 - 可能
所以我正在尝试制作响应式页面。问题是为什么它归结为移动数据需要位于列表中。我会用一些示例代码来解释所以这可能是桌面上的输出 option1
html - 将鼠标悬停在(可能？)
当您将鼠标悬停在a 元素上时，是否可以删除url？这就是我的意思: 最佳答案一种选择是使用一些 JavaScript。删除 href=来自的属性标签，取而代之的是 onclick=...
algorithm - (可能)一个线段树应用
我已经考虑了几个小时，但我无法取得太大进展。它是这样的: You have an array of size n and q queries. Each query is of the form (l
android - 脚本运行速度太快了!可能
我一直在尝试编写一个脚本来强化 android。我没有成功! 我正在通过模拟器运行一个 AVD，并且已经用我加载的 android shell 和 bash shell 试过了。正如您将在下面看到的那
excel - InStr 值数组(可能？)
Private Sub Workbook_Open() Dim WBname As String WBname = ThisWorkbook.name If Not InStr(WBname, "te
scala - Spark 卡在删除广播变量(可能)
Spark 2.0.0-预览版我们有一个应用程序使用了相当大的广播变量。我们在大型 EC2 实例上运行它，因此部署处于客户端模式。广播变量是一个巨大的 Map[String, Array[Strin
regex - 带有xpath或regex的R中的Web抓取(可能)格式不正确的HTML
我正在尝试从此link中提取摘要。但是，我无法仅提取摘要的内容。到目前为止，这是我完成的工作： url <- "http://www.scielo.br/scielo.php?script=sci_a
asp.net - 将ModalPopup移动到IFrame之外。可能？
我的主页中有一个iframe。 iframe页面中有一个modalpopup。因此，当显示modalpopup时，modalpopup的父级是iframe主体和主页父级主体。因此，覆盖层仅覆盖ifra

首页

博学

6Ren·AI

商城

Tensorflow 2.1 获取卷积算法失败。这可能是因为 cuDNN 初始化失败