python - 批量归一化，是还是否？-6ren

python - 批量归一化，是还是否？

转载作者：行者123 更新时间：2023-12-02 16:54:50

24

4

我使用 Tensorflow 1.14.0 和 Keras 2.2.4。以下代码实现了一个简单的神经网络:

import numpy as np
np.random.seed(1)
import random
random.seed(2)
import tensorflow as tf
tf.set_random_seed(3)

from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Input, Dense, Activation


x_train=np.random.normal(0,1,(100,12))

model = Sequential()
model.add(Dense(8, input_shape=(12,)))
# model.add(tf.keras.layers.BatchNormalization())
model.add(Activation('linear'))
model.add(Dense(12))
model.add(Activation('linear'))
model.compile(optimizer='adam', loss='mean_squared_error')
model.fit(x_train, x_train,epochs=20, validation_split=0.1, shuffle=False,verbose=2)

20 个 epoch 后的最终 val_loss 为 0.7751。当我取消注释唯一的注释行以添加批量归一化层时，val_loss 更改为 1.1230。

我的主要问题要复杂得多，但同样的事情也会发生。由于我的激活是线性的，因此将批量归一化放在激活之后还是之前并不重要。

问题:为什么批量标准化没有帮助？我可以改变什么，以便批量标准化在不改变激活函数的情况下改善结果吗？

收到评论后更新:

具有一个隐藏层和线性激活的神经网络有点像 PCA。关于这一点有大量的论文。对我来说，此设置在隐藏层和输出的激活函数的所有组合中给出了最小的 MSE。

一些说明线性激活意味着 PCA 的资源:

https://arxiv.org/pdf/1702.07800.pdf

https://link.springer.com/article/10.1007/BF00275687

https://www.quora.com/How-can-I-make-a-neural-network-to-work-as-a-PCA

最佳答案

是的。

你观察到的行为是一个错误——你不需要 BN 就能看到它；左边的图是#V1，右边的图是#V2:

#V1
model = Sequential()
model.add(Dense(8, input_shape=(12,)))
#model.add(Activation('linear')) <-- uncomment == #V2
model.add(Dense(12))
model.compile(optimizer='adam', loss='mean_squared_error')

显然是无意义的，因为在带有 activation=None (=='linear') 的层之后的 Activation('linear') 是一个身份:model.layers[1].output.name == 'activation/activation/Identity:0'。这可以通过获取和绘制中间层输出来进一步确认，这些输出对于 'dense' 和 'activation' 是相同的 - 此处将省略。

所以，激活实际上什么也没做，除了它没有 - 在 1.14.0 和 2.0.0 之间的提交链上的某个地方，这个问题被修复了，尽管我不知道在哪里。使用 TF 2.0.0 和 Keras 2.3.1 进行 BN 的结果如下:

val_loss = 0.840 # without BN
val_loss = 0.819 # with BN

<小时/>

解决方案:更新到 TensorFlow 2.0.0、Keras 2.3.1。

提示:使用 Anaconda带虚拟环境。如果您还没有任何虚拟环境，请运行:

conda create --name tf2_env --clone base
conda activate tf2_env
conda uninstall tensorflow-gpu
conda uninstall keras
conda install -c anaconda tensorflow-gpu==2.0.0
conda install -c conda-forge keras==2.3.1

可能比这更复杂一些，但这是另一个问题的主题。

<小时/>

更新:从 keras 而不是 tf.keras 导入也可以解决问题。

<小时/>

免责声明:BN 在 Keras 中仍然是一个“有争议”的层，尚未完全修复 - 请参阅 Relevant Git ;我计划最终亲自调查它，但出于您的目的，这个答案的修复应该足够了。

我还建议您熟悉 BN 的基础理论，特别是关于它的训练与推理操作；简而言之，批量大小低于 32 是一个非常糟糕的主意，并且数据集应该足够大，以允许 BN 准确地近似测试集 gamma 和 beta。

<小时/>

使用的代码:

x_train=np.random.normal(0, 1, (100, 12))

model = Sequential()
model.add(Dense(8, input_shape=(12,)))
#model.add(Activation('linear'))
#model.add(tf.keras.layers.BatchNormalization())
model.add(Dense(12))
model.compile(optimizer='adam', loss='mean_squared_error')

W_sum_all = []  # fit rewritten to allow runtime weight collection
for _ in range(20):
    for i in range(9):
        x = x_train[i*10:(i+1)*10]
        model.train_on_batch(x, x)

        W_sum_all.append([])
        for layer in model.layers:
            if layer.trainable_weights != []:
                W_sum_all[-1] += [np.sum(layer.get_weights()[0])]
model.evaluate(x[-10:], x[-10:])

plt.plot(W_sum_all)
plt.title("Sum of weights (#V1)", weight='bold', fontsize=14)
plt.legend(labels=["dense", "dense_1"], fontsize=14)
plt.gcf().set_size_inches(7, 4)

导入/预执行:

import numpy as np
np.random.seed(1)
import random
random.seed(2)
import tensorflow as tf
if tf.__version__[0] == '2':
    tf.random.set_seed(3)
else:
    tf.set_random_seed(3)

import matplotlib.pyplot as plt
from tensorflow.keras.models import Model, Sequential
from tensorflow.keras.layers import Input, Dense, Activation

关于python - 批量归一化，是还是否？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58612783/

24

4

0

文章推荐：用于比较列的 R 函数

文章推荐： laravel - 如何在策略中允许 nova 资源操作

文章推荐： angular - 当只有一个条件为真时，两个 mat-error 都显示

文章推荐： clojure - 如何解构 core.logic 中的映射？

jquery - 元素中的多个点 Id a 否否？
编辑感谢您的所有评论和回答。我很困惑，在尝试不同的答案后我能够解决问题，但现在无法重现问题？？？我不知道发生了什么事。我想做的是通过 id 获取一个元素，但是这个 id 中包含多个点，因为 id
Django模型表单如何从Booleanfield输出选择是/否
我正在尝试对 bool 字段进行是/否选择。默认小部件是复选框输入。但是，如果我使用 Select 覆盖默认小部件，则会得到:NameError: Select is not defined 我认为这
iOS7导航栏半透明=否
我有一个背景图像，所有 View 中的图像都相同，但导航栏 traslucent 默认设置为 YES 并且背景不均匀。我尝试了各种解决方案，但没有任何改变:( 我的 AppDelegate.h #im
r - 将二进制变量更改为是/否
所以我有一个要分析的数据框。问题是数据框中有一堆 1 和 0(1 是，0 是否)，而不是是/否。如何修改数据框以使其不是 1 和 0，而是 Yes 和 No，以便我可以使用逻辑回归？我确信有一个我没有
xml - 根据属性的返回值显示是/否
我是 XML/XSL 的新手(比如 2 天新)。我有一行我正在做一个 xsl:value-of 选择，它返回一个 True/False 属性。我想让它显示是/否，但我试图这样做没有成功。下面是我目前的
powershell - 直到用户输入是/否
我正在尝试写一个简单的 do..until循环，它不起作用: $yesNo = Read-Host -Prompt 'Do you want to add alternative DNS names
Java又玩了？ (是/否)
这个问题已经有答案了: How to use this boolean in an if statement? (8 个回答) 已关闭 7 年前。 import java.util.Scanner;
python 动态回答终端提示是/否
提示问题生成器 class SynthesisPromptGenerator: def wait_key(self): ''' Wait for a key press on
python - 在python中自动给出用户输入是/否
我想自动给出输入是/否，而不是通过键盘/用户输入。 user_choice = raw_input("Are you sure want to remove all item (y/n):\n") i
c# - 用户选项是/否
我需要在文件存在时向用户显示一些消息，显示消息“文件存在...你想覆盖它吗？？” if (File.Exists(binaryFilePath)) { Program.DisplayMessa
javascript - 使用多个问题切换是/否
我在一个表格中有 5 个问题，其中一些的回答是"is"/“否”。一旦用户选择其中一个按钮，我希望能够切换是和否按钮。我遇到的问题是，如果其中一个问题得到了回答，并且我回答了下一个问题，它会从所有其他问
linux - 从某一行开始在文件中搜索字符串否
如何使用 bash 脚本在文本文件的某行/之后搜索字符串？例如我想搜索第一次出现的 "version:" 字符串，但不是在文件开头而是在第 1 行。说 35 其中包含文本 *-disk:0 这样我就
c# - 如何在谈话中处理是/否
目前我正在创建一个 Alexa 技能来处理 FAQ 问题和导致直接回复的问题，但我对 alexa 何时需要另一个回复有疑问。例如，如果用户询问， “我应该吃什么” Alexa 会回复“你想吃意大利面
android - 在通过后退按钮离开应用程序之前显示对话框是/否
如果用户反复按下后退按钮，我需要一种方法来检测他们何时处于我的任务/应用程序的最后一个 Activity 并显示“你想退出吗？”在他们返回主屏幕或他们之前运行的任何应用程序之前的对话框。 Hook o
php - 单击时如何使我的删除链接拆分为是/否？
我有一个充满数据的表格，在行的末尾我有一个删除选项。与其链接到一个全新的页面来确认删除，不如将“删除”链接拆分为一个是/否链接，根据单击的内容，删除行或变回“删除”，这样会很整洁。我知道 reddi
java - 添加自签名证书而不提示用户是/否
使用一些批处理文件，我想在 Java Keystore 中添加不受信任的自签名证书。命令是 %JAVA_HOME%/bin/keytool -import -v -trustcacerts -ali
excel - 基于是否值的带有颜色的单元格的条件格式
我有一个充满 IP 地址的电子表格(“IP LIST”)。在该工作簿中，我有第二个电子表格代表 IP 地址部分，该部分属于 IP 地址的较大部分中的打印机(“打印机”)。我已经在“IP LIST”上确
javascript - 如果单击选项“否”，则删除输入值
一旦用户单击"is"并在输入框中输入一个值，但改变主意并单击“否”选项，但输入值仍然存在，如何删除该值 Do you offer rented call center seating on
java - 尝试验证用户是否输入了"is"或“否”
因此，我尝试验证用户是否输入了"is"或“否”，并继续询问，直到他们输入其中之一。这是我到目前为止的代码。 System.out.println("Would you like a Diamond i
java - 谓词方法在是/否/否则回答不回答的情况下返回重复提示
我目前正在关注 Erik Roberts 所著的《Java 的艺术与科学》一书。当在代码中测试是/否/替代答案时，我会因为没有答案而被问两次。 /* * File: YesNoQuestion.ja

首页

博学

6Ren·AI

商城

python - 批量归一化，是还是否？