tensorflow - TF2 : Compute gradients in keras callback in non-eager mode-6ren

tensorflow - TF2 : Compute gradients in keras callback in non-eager mode

转载作者：行者123 更新时间：2023-12-04 10:06:24

26

4

TF 版本:2.2.0-rc3(在 Colab 中)

我在回调中使用以下代码(来自 tf.keras get computed gradient during training )来计算模型中所有参数的梯度。

def on_train_begin(self, logs=None):
        # Functions return weights of each layer
        self.layerweights = []
        for lndx, l in enumerate(self.model.layers):
            if hasattr(l, 'kernel'):
                self.layerweights.append(l.kernel)

        input_tensors = [self.model.inputs[0],
                        self.model.sample_weights[0],
                        self.model.targets[0],
                        K.learning_phase()]

        # Get gradients of all the relevant layers at once
        grads = self.model.optimizer.get_gradients(self.model.total_loss, self.layerweights)
        self.get_gradients = K.function(inputs=input_tensors,outputs=grads)

但是，当我运行它时，出现以下错误。

AttributeError: 'Model' object has no attribute 'sample_weights'

对于 model.targets也发生同样的错误。

如何在回调中获取渐变？

在eager模式下，解决方案 Get Gradients with Keras Tensorflow 2.0作品。但是，我想在非急切模式下使用它。

最佳答案

这是使用 keras 后端捕获梯度的端到端代码。我已经从 model.fit 的回调中调用梯度捕获函数来捕获每个 epoch 结束后的梯度。 这段代码在 tensorflow 1.x 和 tensorflow 2.x 版本中都是兼容的，而且我已经在 colab 中运行了它。 如果你想在 tensorflow 1.x 中运行，那么将程序中的第一条语句替换为 %tensorflow_version 1.x并重新启动运行时。

捕获模型的梯度 -

# Importing dependency
%tensorflow_version 2.x
from tensorflow import keras
from tensorflow.keras import backend as K
from tensorflow.keras import datasets
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation, Dropout, Flatten, Conv2D, MaxPooling2D
from tensorflow.keras.layers import BatchNormalization
import numpy as np
import tensorflow as tf

tf.keras.backend.clear_session()  # For easy reset of notebook state.
tf.compat.v1.disable_eager_execution()

# Import Data
(train_images, train_labels), (test_images, test_labels) = datasets.cifar10.load_data()

# Build Model
model = Sequential()
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(Flatten())
model.add(Dense(64, activation='relu'))
model.add(Dense(10))

# Model Summary
model.summary()

# Model Compile 
model.compile(optimizer='adam',
              loss=keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Define the Gradient Fucntion
epoch_gradient = []

# Define the Gradient Function
def get_gradient_func(model):
    grads = K.gradients(model.total_loss, model.trainable_weights)
    inputs = model._feed_inputs + model._feed_targets + model._feed_sample_weights
    func = K.function(inputs, grads)
    return func

# Define the Required Callback Function
class GradientCalcCallback(keras.callbacks.Callback):
  def on_epoch_end(self, epoch, logs=None):
      get_gradient = get_gradient_func(model)
      grads = get_gradient([train_images, train_labels, np.ones(len(train_labels))])
      epoch_gradient.append(grads)

epoch = 4

model.fit(train_images, train_labels, epochs=epoch, validation_data=(test_images, test_labels), callbacks=[GradientCalcCallback()])


# (7) Convert to a 2 dimensiaonal array of (epoch, gradients) type
gradient = np.asarray(epoch_gradient)
print("Total number of epochs run:", epoch)
print("Gradient Array has the shape:",gradient.shape)

输出 -

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d (Conv2D)              (None, 30, 30, 32)        896       
_________________________________________________________________
max_pooling2d (MaxPooling2D) (None, 15, 15, 32)        0         
_________________________________________________________________
conv2d_1 (Conv2D)            (None, 13, 13, 64)        18496     
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 6, 6, 64)          0         
_________________________________________________________________
conv2d_2 (Conv2D)            (None, 4, 4, 64)          36928     
_________________________________________________________________
flatten (Flatten)            (None, 1024)              0         
_________________________________________________________________
dense (Dense)                (None, 64)                65600     
_________________________________________________________________
dense_1 (Dense)              (None, 10)                650       
=================================================================
Total params: 122,570
Trainable params: 122,570
Non-trainable params: 0
_________________________________________________________________
Train on 50000 samples, validate on 10000 samples
Epoch 1/4
50000/50000 [==============================] - 73s 1ms/sample - loss: 1.8199 - accuracy: 0.3834 - val_loss: 1.4791 - val_accuracy: 0.4548
Epoch 2/4
50000/50000 [==============================] - 357s 7ms/sample - loss: 1.3590 - accuracy: 0.5124 - val_loss: 1.2661 - val_accuracy: 0.5520
Epoch 3/4
50000/50000 [==============================] - 377s 8ms/sample - loss: 1.1981 - accuracy: 0.5787 - val_loss: 1.2625 - val_accuracy: 0.5674
Epoch 4/4
50000/50000 [==============================] - 345s 7ms/sample - loss: 1.0838 - accuracy: 0.6183 - val_loss: 1.1302 - val_accuracy: 0.6083
Total number of epochs run: 4
Gradient Array has the shape: (4, 10)

希望这能回答你的问题。快乐学习。

关于tensorflow - TF2 : Compute gradients in keras callback in non-eager mode，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61568665/

26

4

0

文章推荐： python - Pandas:如何将多个数据帧 reshape 为一种通用形式？

文章推荐： python - bs4 未获取所有列表项

java - RxJava : what is difference between callbacks in doOnError ('callback' ) and subscribe(*, 'callback')
在我的上一个项目中，我使用了 rxJava，我意识到 observable.doOnError('onErrorCallback').subscribe(action) 和 observable.su
c++ - 为什么 (*callback)() 有效，而 *callback() 或 *callback 在 C++ 中不起作用
我是一名 C++ 初学者，我认为要真正学习指针和引用，我应该尝试创建一个回调函数，这是我在 JavaScript 中认为理所当然的事情。但是，对于我的一生，我不知道为什么这些括号在 (*callba
callback - 达特朗 : How to implemet a callback method
我在库中有一个类，它具有在事件发生时执行的“onMessage”方法。 OnMessage 在执行时需要调用属于主应用程序中的类的“回调”方法。我假设这将通过构造函数完成，但我不知道它是如何实现的。
jquery - $.Callbacks().disable() 与 $.Callbacks().lock()
两者的 jQuery 文档基本上说明了相同的事情，所以我想知道两者之间是否有任何重大差异(如果有的话)。谢谢! 最佳答案这方面的文档实际上非常糟糕，所以这是我在 studying the sourc
javascript - callback && callback() 在 javascript 中是什么意思
这个问题在这里已经有了答案: Using &&'s short-circuiting as an if statement? (6 个答案) Omitting the second expressi
callback - 戈朗 : evaluate variable in callback declaration
我正在尝试在 golang 中定义一个回调: package main func main() { x, y := "old x ", "old y" callback
callback - 谷歌图表 API : adding arguments to existing callback
我有一个页面，其中包含从 Google 电子表格生成的许多图表。典型代码如下所示: var url = "http://my.googlespreadsheet.com/tq?argumentshe
callback - 订阅已弃用 : Use an observer instead of an error callback
当我运行 linter 时，它显示: subscribe is deprecated: Use an observer instead of an error callback 代码来自 this a
c# - Callback 与 new AsyncCallback(Callback) 有什么不同？
对于异步套接字 // accept ... listener.BeginAccept( new AsyncCallback(AcceptCallback), listener); // listene
javascript - 根据 callback(true)/callback(false) 执行操作
我希望能够根据在前面的函数中调用的是 callback(true) 还是 callback(false) 在回调函数中执行一些逻辑。示例: foo.doFunction = function (pa
javascript - jQuery:以下代码块中比较的含义是什么 - callback && function() {callback.call();}
从 jQuery.scrollTo.js 库中看到这个 block (在 v1.4 的第 184 行)。 function animate( callback ){ $elem.animate
android - "callback(value)"和 "callback.invoke(value)"有什么区别？
我正在尝试在我的应用中使用一些回调，它与 "callback(value)" 和 "callback.invoke(value)" 一起工作正确调用回调。我想知道“回调(值)”是否只是一个缩短版本，
python - 访问 tf.keras.callbacks.Callback 中已弃用的属性 "validation_data"
我决定从 keras 切换到 tf.keras(建议使用 here)。因此我安装了 tf.__version__=2.0.0和 tf.keras.__version__=2.2.4-tf .在我的旧版
javascript - nodejs return callback() 和 just callback() 有什么区别
我认为这实际上可能会回答我关于 Stack Overflow 的另一个问题如果我能确认这一点。返回回调和只调用回调有什么区别？我看到代码执行其中之一/或/两者，并试图思考为什么以及何时执行哪个。
callback - 如何 : Idiomatic Rust for callbacks with gtk (rust-gnome)
我目前正在学习 Rust 并希望用它来开发 GUI基于 GTK+ 的应用程序。我的问题与注册回调有关在这些回调中响应 GTK 事件/信号和变异状态。我有一个有效但不优雅的解决方案，所以我想问一下是否有
javascript - React_Redux : Pass parameter in callback during continually callback function
我在回调函数中传递参数时遇到问题。我使用 redux-form，当我更改 SkinList 中的选择时，它会触发 onChange 回调 - activeSkinChange 方法在activeSk
javascript - Node : Dealing with Multiple Promise callbacks (Callback hell)
我有 8 个相互依赖的回调。我的想法是要有一个更具可读性的过程，但我不明白如何处理这个问题。我的回调 hell 的一个例子是: return new Promise(function (resolv
How do I use the result of a callback and pass that result to the next callback?(如何使用回调的结果并将该结果传递给下一个回调？)
因此，我的函数接受一个值和任意数量的回调作为参数(我应该使用扩散操作符吗？)该函数应该返回通过所有给定回调传递该值的最终结果。。我返回的“CB2(Res1)”不是一个函数。如何将第一个回调的结果传递给
callback - Vert.x 是 "based on callbacks"(而不是 future )是什么意思？
在谈到 future 和回调时，documentation说是 The Vert.x core APIs are based on callbacks to notify of asynchronou
Facebook 连接演示 - 是 "Callback URL"== "Connect Callback URL"吗？
我开始觉得自己很蠢。我正在关注 Facebook-Connect 演示“The Run Around”。当我导航到 http://www.[mysite].com/testing/register_

首页

博学

6Ren·AI

商城

tensorflow - TF2 : Compute gradients in keras callback in non-eager mode