- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在 4x RTX 3090 上运行一个用 TensorFlow 1.x 编写的模型,它需要很长时间 开始培训 比在 1x RTX 3090 中的效果好。尽管在训练开始时,它在 4x 中比在 1x 中更早完成。我在两个 GPU 中都使用 CUDA 11.1 和 TensorFlow 1.14。
其次,当我使用 1x RTX 2080ti 和 CUDA 10.2 和 TensorFlow 1.14 时,它占用的数量更少 开始培训 与具有 11.1 CUDA 和 Tensorflow 1.14 的 1x RTX 3090 相比。暂定,1x RTX 2080ti 需要 5 分钟,1x RTX 3090 需要 30-35 分钟,4x RTX 3090 需要 1.5 小时 开始培训 对于其中一个数据集。
如果有人能帮助我解决这个问题,我将不胜感激。
我在 2080ti 和 3090 机器上使用 Ubuntu 16.04、Core™ i9-10980XE CPU 和 32 GB 内存。
编辑:根据 to this,我发现 TF 在 Ampere 架构 GPU 中需要很长的启动时间。 ,但我仍然不清楚是否是这种情况;如果是这种情况,是否存在任何解决方案?
最佳答案
T.F. 1.x 没有 CUDA 11.1 的二进制文件,所以在开始时,编译需要时间。由于 RTX 3090 使用 PTX 和 JIT 编译器进行编译,因此需要很长时间。
一个通用的解决方案是增加缓存大小,使用代码:-"export CUDA_CACHE_MAXSIZE=2147483648"(这里 2147483648 是缓存大小,您可以通过考虑内存限制和它在帐户中其他进程的使用情况来设置任何数字) .引用 https://www.tensorflow.org/install/gpu为了澄清。由此在后续运行中,启动时间会变小。但即使在此之后,二进制文件(在此开始时)也将与 CUDA 11.1 不兼容
最好是从 T.F. 1.x 到 2.x(2.4+) 使其在 RTX 30XX 系列上运行或尝试编译 T.F.来自带有 CUDA 11.1 的源代码的 1.x(不确定)。
关于rtx 3090 上的 Tensorflow 1.14 性能问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64462347/
RTX 3080显卡采用了很多的新功能和新的材料,让很多喜欢显卡的用户都非常的喜欢,而今天我们就给大家带来了RTX 3080评测、跑分、价格、参数、图片,快来一起了解一下吧。 RTX 3080
使用 AMILIE SDK RTX4140_...通过 RTX 编译项目后如何在 RTX 开发套件中部署十六进制文件[Board]。 开发套件设备图像 http://www.rtx.dk/RTX41x
万众期待的RX 6800显卡已经成功发布了受到了很多用户的期待,而且里面还加入了很多的新功能可以让你更好的发挥性能,具体的信息就来看看下面的RX 6800评测、跑分、价格、参数、图片吧。 RX
我们必须在我们的项目中使用 RL-RTX (RTOS)。我们必须制作一些网页。我们有使用“go-ahead webserver”在 Linux 中构建网页的经验。 我们可以用 C 语言编码并将可执行文
FreeRTOS 和 CMSIS-RTOS 有什么区别?谁能解释这两个 RTOS 的相似之处或不同之处? 最佳答案 我认为这里的混淆来源是存在 CMSIS-RTOS API( v1 和 v2 ),并且
我使用 Java 创建了一个记事本应用程序,它位于 jar 文件中。 我使用它创建了一个文本文件,并使用文件扩展名 .rtx 将其保存。 现在我想在 Windows 或任何其他平台中右键单击 file
NVIDIA GeForce RTX 3070 with CUDA capability sm_86 is not compatiblewith the current PyTorch install
我正在 4x RTX 3090 上运行一个用 TensorFlow 1.x 编写的模型,它需要很长时间 开始培训 比在 1x RTX 3090 中的效果好。尽管在训练开始时,它在 4x 中比在 1x
这是我在 64gb ram CPU 上尝试运行的训练代码暗恋 RTX 2070 config = tf.ConfigProto() config.gpu_options.per_process_gpu
由于与 VR 的一些兼容性问题,我正在尝试使用我的 RTX 3080 将 7200x3600 60fps h265 视频转换为 h264 编解码器。 此命令行导致“No NVENC capable d
我们在KEIL IDE中有一个LPC2148的项目,里面有RTX内核程序和其他程序,它是由ARM CC编译的。现在我们需要将IDE从KEIL(ARM CC)更改为Eclipse(GCC)。当我们尝试在
我目前正在尝试使用去年发布的深度学习算法(https://github.com/talmo/leap)来分析小鼠的行为。到目前为止,我已经使用了 Quadro P400,它与 CUDA 9.0 配合得
我正在尝试在我的 RTX 3070 GPU 上训练我的 tensorflow 模型。我正在使用 anaconda 虚拟环境,提示显示已成功检测到 GPU,并且没有显示任何错误或警告,但只要模型开始训练
在我使用 RTX2070 SUPER 运行 Pytorch Yolov4 之前,现在我的 PC 已更改为使用 RTX3060、ASUS KO GeForce RTX™ 3060 OC。 我已经删除了现
您好,我想知道让 ARM Cortex M0+ 进入深度 sleep 的正确方法是什么。特别是我正在使用 CMSIS-RTOS RTX。 我的 IRQ 处理方式是 ISR 只是设置 OS Signal
我正在尝试使用 OPENCV_DNN_CUDA=ON 构建 OpenCV 4.2.0在 Ubuntu 18.04 中,但即使我有一个具有 CC 7.5 的 NVIDIA 2080TI GPU,我也会收
我今天刚拿到 2080 ti,并将其连接起来,在我的模型上进行 Keras 实验。但由于某种原因,当我在密集模型上训练时,2080 ti 比我的 CPU(i7 4790k)慢 2 倍,而且肯定比我的旧
如果我运行以下命令: import torch import sys print('A', sys.version) print('B', torch.__version__) print('C',
这是我的系统规范: 使用 Windows 10 和 Ubuntu 20.04 进行双启动 AMD 锐龙 3700X、x570 Aorus、Nvidia RTX 3090 GPU 技嘉 Titan Ri
我是一名优秀的程序员,十分优秀!