TensorFlow - 在 fit_generator 中使用 class_weights 导致内存泄漏-6ren

TensorFlow - 在 fit_generator 中使用 class_weights 导致内存泄漏

转载作者：行者123 更新时间：2023-12-05 05:09:43

27

4

在 TensorFlow 中，当在 fit_generator 中使用 class_weights 时，会导致训练过程不断消耗越来越多的 CPU RAM，直到耗尽。每个纪元后内存使用量都会逐步增加。请参阅下面的可重现示例。为了使可重现的示例变小，我减小了数据集的大小和批大小，这显示了内存增加的趋势。在使用我的实际数据进行训练时，它耗尽了 70 EPOCS 的全部 128GB RAM。

有人遇到过这个问题或者对此有什么建议吗？我的数据有不平衡的数据，所以我必须使用 class_weights 但我不能用它长时间运行训练。

在下面的代码示例中，如果您注释掉类别权重，则程序会在不耗尽内存的情况下进行训练。

第一张图片显示了使用 class_weights 的内存使用情况，而第二张图片显示了没有使用 class_weights 的内存使用情况。

import tensorflow as tf
tf.enable_eager_execution()
import numpy as np

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import CuDNNLSTM, Dense
from tensorflow.keras.optimizers import Adadelta


feature_count = 25
batch_size = 16
look_back = 5
target_groups = 10

def random_data_generator( ):
    x_data_size =(batch_size, look_back, feature_count) # batches, lookback, features
    x_data = np.random.uniform(low=-1.0, high=5, size=x_data_size)

    y_data_size = (batch_size, target_groups)
    Y_data = np.random.randint(low=1, high=21, size=y_data_size)

    return x_data, Y_data

def get_simple_Dataset_generator():        
    while True:
        yield random_data_generator()

def build_model():
    model = Sequential()
    model.add(CuDNNLSTM(feature_count,
                    batch_input_shape=(batch_size,look_back, feature_count),
                    stateful=False))  
    model.add(Dense(target_groups, activation='softmax'))
    optimizer = Adadelta(learning_rate=1.0, epsilon=None) 
    model.compile(loss='categorical_crossentropy', optimizer=optimizer) 
    return model


def run_training():

    model = build_model()
    train_generator = get_simple_Dataset_generator()
    validation_generator = get_simple_Dataset_generator()
    class_weights = {0:2, 1:8, 2:1, 3:4, 4:8, 5:35, 6:30, 7:4, 8:5, 9:3}

    model.fit_generator(generator = train_generator,
            steps_per_epoch=1,
            epochs=1000,            
            verbose=2,
            validation_data=validation_generator,
            validation_steps=20,
            max_queue_size = 10,
            workers = 0, 
            use_multiprocessing = False,
            class_weight = class_weights
            )

if __name__ == '__main__': 
    run_training()

最佳答案

对于任何 future 的用户，每晚构建中似乎存在一个错误，该错误似乎在随后的每晚构建中得到修复。错误报告中有更多详细信息。

https://github.com/tensorflow/tensorflow/issues/31253

关于TensorFlow - 在 fit_generator 中使用 class_weights 导致内存泄漏，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57318714/

27

4

0

文章推荐： powershell - 如何选择数组属性匹配变量的对象？

文章推荐： python - 如何滚动窗口聚合但保留 Pandas 中的唯一索引列？

文章推荐： python - 根据分类数据绘制日期时间(Y 轴)

java - Android - IntentReceiver 泄漏/泄漏/泄漏
IntentReceiver 正在泄漏由于 onDetachedFromWindow 在某些情况下未被调用。 @Override protected void onDetachedFromWind
iPhone - UIImage 泄漏、CGBitmapContextCreateImage 泄漏
好吧，我很难追踪这个内存泄漏。运行此脚本时，我没有看到任何内存泄漏，但我的 objectalloc 正在攀升。 Instruments 指向 CGBitmapContextCreateImage >
iphone - 使用仪器检测 C 泄漏(泄漏)
我编写了一个测试代码来检查如何使用 Instrument(Leaks)。我创建了一个单一 View 应用程序，单击按钮后我加载了一个像这样的新 View ... - (IBAction)btn_clk
Python单调增加内存使用量(泄漏？)
我正在使用这个简单的代码并观察单调增加的内存使用量。我正在使用这个小模块将内容转储到磁盘。我观察到它发生在 unicode 字符串上而不是整数上，我做错了什么吗？当我这样做时: >>> from u
iphone - NSXMLParser 泄漏
我有以下泄漏的代码。 Instruments 表示，泄漏的是 rssParser 对象。我“刷新”了 XML 提要，它运行了该 block 并且发生了泄漏...... 文件.h @interface
iphone - NSFileManager 泄漏
我在我编写的以下代码片段中发现了内存泄漏 NSFileManager *fileManager=[[NSFileManager alloc] init]; fileList=[[fileManager
javascript - 一段时间后HTML5音频停止工作(泄漏)
因此，我正在开发HTML5 / javascript rts游戏。观察一直有几种声音在播放。因此，对我来说，是一段时间后声音听起来像是“崩溃”，并且此浏览器选项卡上的所有声音都停止了工作。我只能通过重
perl - 了解开发::泄漏
下面是我正在使用的一段代码及其输出。 my $handle; my $enterCount = Devel::Leak::NoteSV($handle); print "$date entry $en
Go goroutine 泄漏
在这篇关于 go-routines 泄漏的帖子之后，https://www.ardanlabs.com/blog/2018/11/goroutine-leaks-the-forgotten-sende
c - 执行后内存(泄漏)
我想知道为什么在执行 ./a.out 后随机得到以下结果。有什么想法我做错了吗？谢谢 http://img710.imageshack.us/img710/8708/trasht.png 最佳答案正
ios - 二维码扫描后内存峰值/泄漏
我正在 Swift 中开发一个应用程序，在呈现捕获我放在一起的二维码的自定义 ViewController 后，我注意到出现了巨大的内存跳跃。该代码本质上基于以下示例:http://www.appc
javascript - XMLHttpRequest 泄漏
下面是我的 javascript 代码片段。它没有按预期运行，请帮我解决这个问题。 function getCurrentLocation() { console.log("insi
java - 卡夫卡生产者巨大的内存使用(泄漏？)
我们在生产环境中部署了 3 个代理 Kafka 0.10.1.0。有些应用程序嵌入了 Kafka Producer，它们将应用程序日志发送到某个主题。该主题有 10 个分区，复制因子为 3。我们观察
iphone - appendFormat 泄漏
我正在使用仪器来检测一些泄漏，但有一些泄漏我无法解决； NSMutableString *textedetails = [[NSMutableString alloc] init];
ios - 性能工具 - 泄漏
如果我使用性能工具测试我的代码 - 泄漏，它没有检测到任何泄漏。这是否意味着代码没有泄漏任何内存？我有一个越狱的 iPhone，我可以监控可用内存。如果有人知道，那就是 SBSettings。我测试
ios - ABPersonCopyImageData 泄漏
我在从 AddressBook 中获取图像时遇到了很大的问题，下面我粘贴了我的代码。此 imageData 从未被释放，在我的 Allocations Instruments 上它看起来总是在内存中它
ios - class_copyIvarList 泄漏
- (NSMutableArray *)getArrayValue:(NSArray *)array{ NSMutableArray *valueArray = [NSMutableArra
读取字符串值时 iPhone 泄漏
Instruments 工具说这是一个泄漏，有什么想法吗？我在 for 循环结束时释放变量对象在上述方法的开头，这就是我设置变量对象的方式，即自动释放； NSMutableArray *varia
ios - 泄漏 CGImageMergeXMPPropsWhithLegacyProps
我正在跟踪我的 iOS 应用程序的内存泄漏，我有一个奇怪的泄漏导致我的应用程序崩溃......负责的框架是:CGImageMergeXMPPropsWhithLegacyProps。在某些时候，我的应
ios - NSOperationQueue 泄漏？
我正在尝试使用 NSOperationQueue 在后台线程中执行一个方法，如下所示: NSOperationQueue *queue = [NSOperationQueue new]; NS

首页

博学

6Ren·AI

商城

TensorFlow - 在 fit_generator 中使用 class_weights 导致内存泄漏