python - 如何利用 Tensorflow 100% 的 GPU 内存？-6ren

python - 如何利用 Tensorflow 100% 的 GPU 内存？

转载作者：太空狗更新时间：2023-10-30 02:51:09

25

4

我有一个 32Gb 显卡，在我的脚本开始时我看到:

2019-07-11 01:26:19.985367: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 95.16G (102174818304 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:19.988090: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 85.64G (91957338112 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:19.990806: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 77.08G (82761605120 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:19.993527: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 69.37G (74485440512 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:19.996219: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 62.43G (67036893184 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:19.998911: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 56.19G (60333203456 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:20.001601: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 50.57G (54299881472 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:20.004296: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 45.51G (48869892096 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:20.006981: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 40.96G (43982901248 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:20.009660: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 36.87G (39584608256 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2019-07-11 01:26:20.012341: E tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 33.18G (35626147840 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY

之后 TF 使用了我 96% 的内存。后来，当它用完内存时，它会尝试分配 65G

tensorflow/stream_executor/cuda/cuda_driver.cc:936] failed to allocate 65.30G (70111285248 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY

我的问题是，剩下的 1300MB (0.04*32480) 怎么办？我不介意在运行 OOM 之前使用它们。

如何让 TF 使用 99.9% 的内存而不是 96%？

更新: nvidia-smi 输出

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 418.40.04    Driver Version: 418.40.04    CUDA Version: 10.1     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla V100-SXM2...  On   | 00000000:00:16.0 Off |                    0 |
| N/A   66C    P0   293W / 300W |  31274MiB / 32480MiB |    100%      Default |

我问的是这 1205MB (31274MiB - 32480MiB) 剩余未使用的空间。也许它们在那里是有原因的，也许它们是在 OOM 之前使用的。

最佳答案

监控GPU并不像监控CPU那么简单。正在进行的许多并行进程可能会为您的 GPU 造成瓶颈。

可能会出现各种问题，例如:
1. 数据读写速度
2.CPU或磁盘造成瓶颈

不过我觉得用96%还是挺正常的。更不用说 nvidia-smi 仅针对一个特定实例显示。

您可以安装 gpustat 并使用它实时监控 GPU(您应该在 OOM 期间达到 100%)

pip install gpustat

gpustat -i

你能做什么？
1.可以用data_iterator更快地并行处理数据。
2. 增加批量。 (我不认为这对你的情况有用，因为你正在点击 OOM)
3.你可以超频GPU(不推荐)

Here是一篇关于硬件加速的好文章。

关于python - 如何利用 Tensorflow 100% 的 GPU 内存？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56994738/

25

4

0

文章推荐： python - 为 % 创建一个 Groupby Grand Total 行

文章推荐： python - ＆符号在打印功能中如何工作？

文章推荐： python - 使用正则表达式读取日志

利用.htaccess的Rewrite规则实现Discuz论坛的伪静态链接
在后台开启了“URL Rewrite”，看起来一切正常，可是点击某一栏目的时候却怎么都进不去，显示的依然是论坛的首页。看了一下论坛目录下，原来这下面并没有自己的.htaccess文件，所以默认使用的
利用.net代码实现发送邮件
本文实例为大家分享了.net发送邮件的实现代码，供大家参考，具体内容如下关键代码：需要引用命名空间： using System.Net.Mail; using System.Net;
利用.net控件实现下拉导航菜单制作的具体方法
今天的一个小测试是老师让用.NET用控件来制作一个拉菜单要求如下：将鼠标移到父菜单上弹出3个子菜单，而且每个子菜单都有超链接。以下是我自己做的代码：复制代
c++ - 利用 max_element？
我有以下内容 static const unsigned int chromosome = 6; double bestFitness[chromosomes]; for(int i = 0; i
利用 2 轴运动计算抛物线路径的算法
关于附图，我需要一个计算算法来将 A 轴向下移动 n 英寸，将 B 轴从左向右移动 m 英寸，以便组件圆 D 遵循抛物线的曲线；圆 D 并不总是 10 英寸，可以更小。我不是数学专业的，所以这对我来说
linux - 格式字符串错误 - 利用
我正在尝试利用我的格式字符串错误，它存在于这个程序中: #include #include #include #include #include void foo(char* tmp, ch
利用 Python 让图表动起来
用Matplotlib和Seaborn这类Python库可以画出很好看的图，但是这些图只是静态的，难以动态且美观地呈现数值变化。要是在你下次的演示、视频、社交媒体Po文里能用短视频呈现数据变化，是不
利用 Python 实现多任务进程
1、进程介绍进程：正在执行的程序，由程序、数据和进程控制块组成，是正在执行的程序，程序的一次执行过程，是资源调度的基本单位。程序：没有执行的代码，是一个静态的。 2、线程
利用 JavaScript 实现并发控制的示例代码
1、前言在开发过程中，有时会遇到需要控制任务并发执行数量的需求。例如一个爬虫程序，可以通过限制其并发任务数量来降低请求频率，从而避免由于请求过于频繁被封禁问题的发生。接下来
利用 Opera 浏览器中存储的XSS漏洞读取本地文件
Opera 管理着一个漏洞赏金计划，研究人员可以在该计划中报告 Opera 软件中的漏洞并获得奖励。这篇文章就是我发现的一个漏洞——网页可能会从用户那里检索本地文件的屏幕截图。考虑到 O
C++利用 _findfirst与_findnext查找文件的方法
C++ 文件查找在C++中我们要如何查找文件呢？我们需要一个结构体和几个大家可能不太熟悉的函数。这些函数和结构体在的头文件中，结构体为struct _finddata_t ，函数为_findfi
利用 fsockopen() 函数开放端口扫描器的实例
1、前言本文利用 fsockopen() 函数，编写一个功能简单的端口扫描器。 2、关键技术本实例的端口号是固定的，通过对数组的遍历，利用 fsockopen() 函数连接，如果连接成功，
利用.net core实现反向代理中间件的方法
最近在将一些项目的rest api迁移到.net core中，最开始是用的Nginx做反向代理，将已经完成切换的部分切入系统，如下图所示：由于迁移过程中也在进行代码重构，需要经常比较频繁的测
利用 python 对目录下的文件进行过滤删除
前言最近学习了python，感觉挺多地方能用到它的。打包测试上传爬电影....而且代码量是真少。人生苦短，我用python。而今天写的这个是因为下载电影时总会发现除了视频还会有这两个文件,
利用 Monkey 命令操作屏幕快速滑动
1、Monkey测试简介 Monkey测试是Android平台自动化测试的一种手段，通过Monkey程序模拟用户触摸屏幕、滑动Trackball、按键等操作来对设备上的程序进行压力测试，检测程序
利用 cache 做对比静态页的网页技术
一直想写一套生成静态页面的文章系统但面对生成静态后的一些复杂数据库交互问题。又望而却步！于是就想有没有在不耽误数据交互的情况下，而又能降低服务器负
qt - 利用 Qt 依赖项避免二进制文件重复
Qt 利用大量第 3 方库进行图像编码、压缩、加密、音频和视频编解码器支持等。从历史上看，当我想使用它们时，我总是必须将它们作为附加依赖项包含在内。我一直想知道是否有一种方法可以简单地重用 Qt 已
.net - 利用 .NET 属性的力量
我想知道是否可以使用属性将功能“混合”到类/方法/属性中。就像是: [TrackChanges] public Foo { get; set; } 如果可能的话，有谁会如何实现？最佳答
.net - 利用.net中的web.config使用浏览器缓存？
有些站点位于共享主机(Windows 2003 Server)上，因此我无法访问服务器配置。我到处都读到关于杠杆浏览器缓存的信息，特别是静态文件(jpg，css，js等)的信息，但是...在我的情况
julia - 利用 Julia 的集成能力
我想在我的项目中使用 Julia 的主要原因之一是它的速度，尤其是在计算积分方面。我想在某个区间 [a,b] 上积分一维函数 f(x)。一般来说，Julia 的 quadgk 函数将是一个快速而准确

首页

博学

6Ren·AI

商城

python - 如何利用 Tensorflow 100% 的 GPU 内存？