python - 如何在自定义 Keras 模型中使用 BatchNormalization 层-6ren

python - 如何在自定义 Keras 模型中使用 BatchNormalization 层

转载作者：行者123 更新时间：2023-12-01 07:26:01

我目前正在学习在我的项目中使用 Tensorflow-2.0。我想使用卷积神经网络(CNN)完成一个语义分割任务，在编码时发现一个奇怪的错误。

首先，构建了一个简单的模型并且运行良好。

X_train,y_train = load_data()

input = tf.keras.layers.Input((512,512,7))
c1 = tf.keras.layers.Conv2D(64,3,padding='same',activation='relu')(input)
c1 = tf.keras.layers.BatchNormalization()(c1)
c1 = tf.keras.layers.Conv2D(64,3,padding='same',activation='relu')(c1)
c1 = tf.keras.layers.BatchNormalization()(c1)
c1 = tf.keras.layers.Conv2D(3,3,padding='same',activation='softmax')(c1)
model = tf.keras.models.Model(inputs=[input],outputs=[c1])

model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),
              loss=tf.keras.losses.sparse_categorical_crossentropy,
              metrics=['accuracy'])
results = model.fit(X_train,y_train,batch_size=8,epochs=1000)

但是，当我尝试使用自定义 Keras 模型时，出现了一些错误:

class SequenceEECNN(tf.keras.Model):
    def __init__(self,n_class=3,width=32):
        super(SequenceEECNN,self).__init__(name='SequenceEECNN')
        self.n_class = n_class
        self.width = width
        self.c1 = tf.keras.layers.Conv2D(self.width, 3,activation='relu',padding='same')
        self.c2 = tf.keras.layers.Conv2D(self.width, 3, activation='relu',padding='same')
        self.out = tf.keras.layers.Conv2D(self.n_class,3,activation='softmax',padding='same')

    def call(self, inputs):
        x = self.c1(inputs)
        x = tf.keras.layers.BatchNormalization()(x)
        x = self.c2(x)
        x = tf.keras.layers.BatchNormalization()(x)
        return self.out(x)

X_train,y_train = load_data()

model = SequenceEECNN()

model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),
              loss=tf.keras.losses.sparse_categorical_crossentropy,
              metrics=['accuracy'])
results = model.fit(X_train,y_train,batch_size=8,epochs=1000)

错误日志是:

Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where
Train on 128 samples
Epoch 1/1000
2019-08-11 16:21:27.377452: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcudnn.so.7
2019-08-11 16:21:27.378136: W tensorflow/core/framework/op_kernel.cc:1546] OP_REQUIRES failed at resource_variable_ops.cc:268 : Not found: Resource localhost/_AnonymousVar10/N10tensorflow3VarE does not exist.
2019-08-11 16:21:27.378156: W tensorflow/core/common_runtime/base_collective_executor.cc:216] BaseCollectiveExecutor::StartAbort Not found: Resource localhost/_AnonymousVar10/N10tensorflow3VarE does not exist.
     [[{{node Adam/gradients/SequenceEECNN/batch_normalization_1/cond_grad/If/then/_52/VariableShape_1}}]]
     [[Func/Adam/gradients/SequenceEECNN/batch_normalization/cond_grad/If/else/_75/input/_230/_72]]
2019-08-11 16:21:27.378314: W tensorflow/core/common_runtime/base_collective_executor.cc:216] BaseCollectiveExecutor::StartAbort Not found: Resource localhost/_AnonymousVar10/N10tensorflow3VarE does not exist.
     [[{{node Adam/gradients/SequenceEECNN/batch_normalization_1/cond_grad/If/then/_52/VariableShape_1}}]]
2019-08-11 16:21:27.378322: W tensorflow/core/framework/op_kernel.cc:1546] OP_REQUIRES failed at resource_variable_ops.cc:268 : Not found: Resource localhost/_AnonymousVar11/N10tensorflow3VarE does not exist.
Traceback (most recent call last):
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/learn_tf2/test_model.py", line 40, in <module>
    results = model.fit(X_train,y_train,batch_size=8,epochs=1000)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/keras/engine/training.py", line 643, in fit
    use_multiprocessing=use_multiprocessing)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_arrays.py", line 664, in fit
    steps_name='steps_per_epoch')
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/keras/engine/training_arrays.py", line 383, in model_iteration
    batch_outs = f(ins_batch)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/keras/backend.py", line 3510, in __call__
    outputs = self._graph_fn(*converted_inputs)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/eager/function.py", line 572, in __call__
    return self._call_flat(args)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/eager/function.py", line 671, in _call_flat
    outputs = self._inference_function.call(ctx, args)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/eager/function.py", line 445, in call
    ctx=ctx)
  File "/media/xrzhang/Data/ZHS/Research/CNN-TF2/venv/lib/python3.6/site-packages/tensorflow/python/eager/execute.py", line 67, in quick_execute
    six.raise_from(core._status_to_exception(e.code, message), None)
  File "<string>", line 3, in raise_from
tensorflow.python.framework.errors_impl.NotFoundError: 2 root error(s) found.
  (0) Not found:  Resource localhost/_AnonymousVar10/N10tensorflow3VarE does not exist.
     [[{{node Adam/gradients/SequenceEECNN/batch_normalization_1/cond_grad/If/then/_52/VariableShape_1}}]]
     [[Func/Adam/gradients/SequenceEECNN/batch_normalization/cond_grad/If/else/_75/input/_230/_72]]
  (1) Not found:  Resource localhost/_AnonymousVar10/N10tensorflow3VarE does not exist.
     [[{{node Adam/gradients/SequenceEECNN/batch_normalization_1/cond_grad/If/then/_52/VariableShape_1}}]]
0 successful operations.
0 derived errors ignored. [Op:__inference_keras_scratch_graph_1409]

Function call stack:
keras_scratch_graph -> keras_scratch_graph

而且我发现，如果我删除调用函数中的 BatchNormalization 层，代码就会正常工作:

class SequenceEECNN(tf.keras.Model):
    def __init__(self,n_class=3,width=32):
        super(SequenceEECNN,self).__init__(name='SequenceEECNN')
        self.n_class = n_class
        self.width = width
        self.c1 = tf.keras.layers.Conv2D(self.width, 3,activation='relu',padding='same')
        self.c2 = tf.keras.layers.Conv2D(self.width, 3, activation='relu',padding='same')
        self.out = tf.keras.layers.Conv2D(self.n_class,3,activation='softmax',padding='same')

    def call(self, inputs):
        x = self.c1(inputs)
        # x = tf.keras.layers.BatchNormalization()(x) remove any BatchNorm layer
        x = self.c2(x)
        x = tf.keras.layers.BatchNormalization()(x)
        return self.out(x)

所以这个错误可能是关于 BatchNormalization 层使用不当造成的。我的TensorFlow版本是2.0.0-beta1。为什么会出现这个错误？我该如何修复这个错误？感谢您的帮助!

最佳答案

tf.keras.layers.BatchNormalization 是一个可训练层，这意味着它具有将在向后传递期间更新的参数(即 gamma 和beta 对应于每个特征的学习方差和平均值)。

为了传播梯度，必须在 Tensorflow 图中注册该层。当您分配给 self 时，此操作是在 __init__ 内部完成的，因此，如果您在 call 内部创建此层，它将无法正确注册。

应该正常工作的代码:

class SequenceEECNN(tf.keras.Model):
    def __init__(self, n_class=3, width=32):
        super().__init__()
        self.n_class = n_class
        self.width = width
        self.first = tf.keras.Sequential(
            [
                tf.keras.layers.Conv2D(
                    self.width, 3, activation="relu", padding="same"
                ),
                tf.keras.layer.BatchNormalization(),
            ]
        )
        self.second = tf.keras.Sequential(
            [
                tf.keras.layers.Conv2D(
                    self.width, 3, activation="relu", padding="same"
                ),
                tf.keras.layer.BatchNormalization(),
            ]
        )
        self.out = tf.keras.layers.Conv2D(
            self.n_class, 3, activation="softmax", padding="same"
        )

    def call(self, inputs):
        x = self.first(inputs)
        x = self.second(x)
        return self.out(x)

此外，我还使用了Sequential，因此操作可以更好地保持在一起。

关于python - 如何在自定义 Keras 模型中使用 BatchNormalization 层，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57448488/

文章推荐： Python 使串行输出可供其他脚本访问

文章推荐： java - 我的 ArrayList 中的值被覆盖

文章推荐： java - Guava Collections2.transform 不起作用

文章推荐： json - 为什么我从 jQuery Ajax 操作中收到 JSON 解析错误？

python - TimeDistributed(BatchNormalization) 与 BatchNormalization
BatchNormalization 和 TimeDistributed(BatchNormalization) 是否对顺序数据(例如视频)有相同的影响？如果不是有什么区别？最佳答案在 tf.ke
python - Pytorch Batchnorm 层与 Keras Batchnorm 不同
我正在尝试将预训练的 BN 权重从 pytorch 模型复制到其等效的 Keras 模型，但我不断得到不同的输出。我阅读了 Keras 和 Pytorch BN 文档，我认为区别在于它们计算“均值”
python - CNN 训练准确度与 BatchNorm 停滞不前，在没有 BatchNorm 的情况下快速过度拟合
我有两种类型的灰度图像，比如汽车和飞机。在我的训练集中，我有 1000 张图像(大约 50/50 分割)。在这个训练集中，我所有的飞机示例都在白色背景上，而所有汽车示例都在黑色背景上(这是故意的，模型
tensorflow - Keras Batchnormalization，训练数据集的训练和评估结果不同
我正在训练一个 CNN，为了调试我的问题，我正在研究实际训练数据的一小部分。在训练期间，损失和准确性似乎非常合理且相当不错。 (在示例中我使用了相同的小子集进行验证，问题已经在这里显示了) 适合 x
machine-learning - Batchnorm 中的反向传播更新错误
我有这些 Backprop 更新，请让我知道 dx 部分哪里出了问题。在计算图中，我使用X、sample_mean 和sample_var。感谢您的帮助 (x, norm, sample_mean,
machine-learning - "BatchNorm"层在caffe中应该如何使用？
我对如何使用/插入"BatchNorm"有点困惑我的模型中的图层。我看到了几种不同的方法，例如: ResNets : "BatchNorm"+"Scale" (无参数共享) “BatchNorm”
python - Keras BatchNormalization，究竟什么是样本标准化？
我想弄清楚 Keras 中的批量归一化究竟做了什么。现在我有以下代码。 for i in range(8): c = Convolution2D(128, 3, 3, border_mode
python - Keras BatchNormalization 未初始化值
我正在尝试将批量规范添加到 Keras 中的 vgg 样式模型。当我添加 batch norm 层时，出现错误: FailedPreconditionError: Attempting to use
python - keras BatchNormalization 轴说明
keras BatchNormalization layer使用 axis=-1 作为默认值，并说明特征轴通常是归一化的。为什么会这样？我想这很令人惊讶，因为我更熟悉使用类似 StandardSca
python - BatchNorm 动量约定 PyTorch
是 batchnorm momentum convention (默认值=0.1)与其他库一样正确，例如Tensorflow 好像一般默认是 0.9 或者 0.99？或者也许我们只是使用了不同的约定？
keras - 意外地发现了一个 BatchNormalization 类型的实例。期望符号张量实例
在 Keras 中实现 Residual Network 时出现错误。下面是给我错误的代码(错误来自函数定义最后一步的第一行): 加载包: import numpy as np from keras
python - 如何在此 Tensorflow 模型中保存和加载 BatchNormalization 层？
我正在尝试保存模型，然后稍后加载它以进行一些预测；发生的事情是训练后模型的准确率是95%+ ，但是当我保存它然后加载它时，准确度下降到接近 10%在同数据集。要重现此错误结果，您可以运行 thi
keras - 与 BatchNormalization 层相关的参数数量是 2048 个？
我有以下代码。 x = keras.layers.Input(batch_shape = (None, 4096)) hidden = keras.layers.Dense(512, activati
keras - 时间序列数据的 BatchNormalization 层的 axis 参数设置什么？
我正在通过时间序列数据训练 LSTM 网络，并希望对数据进行标准化，因为我的特征具有不同的规模。我的数据形状是 (n_samples x n_timestamps x n_features) 我想使
python - 如何在自定义 Keras 模型中使用 BatchNormalization 层
我目前正在学习在我的项目中使用 Tensorflow-2.0。我想使用卷积神经网络(CNN)完成一个语义分割任务，在编码时发现一个奇怪的错误。首先，构建了一个简单的模型并且运行良好。 X_train
machine-learning - Keras/TensorFlow BatchNormalization 正在规范化什么
我的问题是 BatchNormalization (BN) 正在标准化什么。我问，BN 是单独对每个像素的 channel 进行归一化，还是对所有像素一起归一化。它是在每个图像的基础上还是在整个批处
machine-learning - 仅在 Keras 中对某些输入进行 BatchNormalization
我的 LSTM 网络有 5 个输入。第一个输入的典型值为 1000 到 3000。其余输入的值为 -1 到 1。我想插入 BatchNormalization 作为第一层。但输入 2-5 已经在 -
python - BatchNormalization 中 (axis = 3) 的含义是什么？
inputs = Input((img_height, img_width, img_ch)) conv1 = Conv2D(n_filters, (k, k), padding=padding)(i
python - 保存使用 BatchNorm 的 Tensorflow 模型
我正在尝试使用 Tensorflow 从 GAN 保存生成器模型。我正在使用的模型有几个批量归一化层。当我保存权重时，只有运行全局变量初始值设定项才能成功恢复它们，但我不必这样做，因为所有变量都正在恢
python - 如何在自定义训练循环中使用 tf.keras.layers.BatchNormalization() ？
过了一段时间我又回到了tensorflow，看起来情况已经完全改变了。但是，之前我曾经在训练循环中使用 tf.contrib....batch_normalization 并进行以下操作: upda

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - 如何在自定义 Keras 模型中使用 BatchNormalization 层