rtx 3090 上的 Tensorflow 1.14 性能问题-6ren

rtx 3090 上的 Tensorflow 1.14 性能问题

转载作者：行者123 更新时间：2023-12-03 13:59:09

24

4

我正在 4x RTX 3090 上运行一个用 TensorFlow 1.x 编写的模型，它需要很长时间 开始培训 比在 1x RTX 3090 中的效果好。尽管在训练开始时，它在 4x 中比在 1x 中更早完成。我在两个 GPU 中都使用 CUDA 11.1 和 TensorFlow 1.14。
其次，当我使用 1x RTX 2080ti 和 CUDA 10.2 和 TensorFlow 1.14 时，它占用的数量更少 开始培训 与具有 11.1 CUDA 和 Tensorflow 1.14 的 1x RTX 3090 相比。暂定，1x RTX 2080ti 需要 5 分钟，1x RTX 3090 需要 30-35 分钟，4x RTX 3090 需要 1.5 小时 开始培训 对于其中一个数据集。
如果有人能帮助我解决这个问题，我将不胜感激。
我在 2080ti 和 3090 机器上使用 Ubuntu 16.04、Core™ i9-10980XE CPU 和 32 GB 内存。
编辑:根据 to this，我发现 TF 在 Ampere 架构 GPU 中需要很长的启动时间。，但我仍然不清楚是否是这种情况；如果是这种情况，是否存在任何解决方案？

最佳答案

T.F. 1.x 没有 CUDA 11.1 的二进制文件，所以在开始时，编译需要时间。由于 RTX 3090 使用 PTX 和 JIT 编译器进行编译，因此需要很长时间。
一个通用的解决方案是增加缓存大小，使用代码:-"export CUDA_CACHE_MAXSIZE=2147483648"(这里 2147483648 是缓存大小，您可以通过考虑内存限制和它在帐户中其他进程的使用情况来设置任何数字) .引用 https://www.tensorflow.org/install/gpu为了澄清。由此在后续运行中，启动时间会变小。但即使在此之后，二进制文件(在此开始时)也将与 CUDA 11.1 不兼容
最好是从 T.F. 1.x 到 2.x(2.4+) 使其在 RTX 30XX 系列上运行或尝试编译 T.F.来自带有 CUDA 11.1 的源代码的 1.x(不确定)。

关于rtx 3090 上的 Tensorflow 1.14 性能问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/64462347/

24

4

0

文章推荐： postgresql - 在 docker 中运行的 Postgres 数据库一直挂起

文章推荐： typescript - 使用 Deno 进行 JWT 身份验证

文章推荐： c# - 如何分离 IObservable 和 IObserver

RTX 3080怎么样?RTX 3080评测跑分参数介绍
RTX 3080显卡采用了很多的新功能和新的材料，让很多喜欢显卡的用户都非常的喜欢，而今天我们就给大家带来了RTX 3080评测、跑分、价格、参数、图片，快来一起了解一下吧。 RTX 3080
c - RTX 开发套件中的项目部署
使用 AMILIE SDK RTX4140_...通过 RTX 编译项目后如何在 RTX 开发套件中部署十六进制文件[Board]。开发套件设备图像 http://www.rtx.dk/RTX41x
RX 6800怎么样?RTX 6800评测跑分参数介绍
万众期待的RX 6800显卡已经成功发布了受到了很多用户的期待，而且里面还加入了很多的新功能可以让你更好的发挥性能，具体的信息就来看看下面的RX 6800评测、跑分、价格、参数、图片吧。 RX
rl-rtx 中网页的 c 代码
我们必须在我们的项目中使用 RL-RTX (RTOS)。我们必须制作一些网页。我们有使用“go-ahead webserver”在 Linux 中构建网页的经验。我们可以用 C 语言编码并将可执行文
rtos - FreeRTOS 和 CMSIS-RTX 之间的区别
FreeRTOS 和 CMSIS-RTOS 有什么区别？谁能解释这两个 RTOS 的相似之处或不同之处？最佳答案我认为这里的混淆来源是存在 CMSIS-RTOS API( v1 和 v2 )，并且
java - 在 Java 应用程序环境中打开 .rtx 文件？
我使用 Java 创建了一个记事本应用程序，它位于 jar 文件中。我使用它创建了一个文本文件，并使用文件扩展名 .rtx 将其保存。现在我想在 Windows 或任何其他平台中右键单击 file
deep-learning - RTX 3070 与 Pytorch 的兼容性
NVIDIA GeForce RTX 3070 with CUDA capability sm_86 is not compatiblewith the current PyTorch install
rtx 3090 上的 Tensorflow 1.14 性能问题
我正在 4x RTX 3090 上运行一个用 TensorFlow 1.x 编写的模型，它需要很长时间开始培训比在 1x RTX 3090 中的效果好。尽管在训练开始时，它在 4x 中比在 1x
python - 迁移学习——尝试在内存不足的 RTX 2070 上重新训练 efficientnet-B07
这是我在 64gb ram CPU 上尝试运行的训练代码暗恋 RTX 2070 config = tf.ConfigProto() config.gpu_options.per_process_gpu
ffmpeg - 在 RTX 3080 上使用 ffmpeg 在 h264 中编码失败
由于与 VR 的一些兼容性问题，我正在尝试使用我的 RTX 3080 将 7200x3600 60fps h265 视频转换为 h264 编解码器。此命令行导致“No NVENC capable d
eclipse - 在 Eclipse IDE 中使用 GCC 编译器编译 RTX 内核文件
我们在KEIL IDE中有一个LPC2148的项目，里面有RTX内核程序和其他程序，它是由ARM CC编译的。现在我们需要将IDE从KEIL(ARM CC)更改为Eclipse(GCC)。当我们尝试在
python - Windows 10、RTX 2070] : Failed to get convolution algorithm
我目前正在尝试使用去年发布的深度学习算法(https://github.com/talmo/leap)来分析小鼠的行为。到目前为止，我已经使用了 Quadro P400，它与 CUDA 9.0 配合得
python - Tensorflow 在 CPU 而不是 RTX 3000 系列 GPU 上训练
我正在尝试在我的 RTX 3070 GPU 上训练我的 tensorflow 模型。我正在使用 anaconda 虚拟环境，提示显示已成功检测到 GPU，并且没有显示任何错误或警告，但只要模型开始训练
ubuntu - RTX 3060 无法使用 cuda 11.4 运行 Pytorch Yolov4
在我使用 RTX2070 SUPER 运行 Pytorch Yolov4 之前，现在我的 PC 已更改为使用 RTX3060、ASUS KO GeForce RTX™ 3060 OC。我已经删除了现
arm - CMSIS-RTOS Keil RTX - 进入 ARM 深度 sleep 的正确方法
您好，我想知道让 ARM Cortex M0+ 进入深度 sleep 的正确方法是什么。特别是我正在使用 CMSIS-RTOS RTX。我的 IRQ 处理方式是 ISR 只是设置 OS Signal
opencv - 构建 OpenCV 4 需要 CC 5.3 或更高版本 - RTX 2080TI
我正在尝试使用 OPENCV_DNN_CUDA=ON 构建 OpenCV 4.2.0在 Ubuntu 18.04 中，但即使我有一个具有 CC 7.5 的 NVIDIA 2080TI GPU，我也会收
python - Keras - RTX 2080 ti 训练比仅 CPU 和 GTX 1070 慢？
我今天刚拿到 2080 ti，并将其连接起来，在我的模型上进行 Keras 实验。但由于某种原因，当我在密集模型上训练时，2080 ti 比我的 CPU(i7 4790k)慢 2 倍，而且肯定比我的旧
python - Pytorch CUDA 错误 : no kernel image is available for execution on the device on RTX 3090 with cuda 11. 1
如果我运行以下命令: import torch import sys print('A', sys.version) print('B', torch.__version__) print('C',
ubuntu - LG Ultrafine 5K 在 Ubuntu 20.04 双启动 Nvidia RTX 3090 GC Titan Ridge rev 2 上不能作为独立显示器工作
这是我的系统规范: 使用 Windows 10 和 Ubuntu 20.04 进行双启动 AMD 锐龙 3700X、x570 Aorus、Nvidia RTX 3090 GPU 技嘉 Titan Ri

首页

博学

6Ren·AI

商城

rtx 3090 上的 Tensorflow 1.14 性能问题