- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我最近开始使用 Tensorflow,并一直在尽力适应环境。这真是太棒了!然而,使用 tf.contrib.layers.batch_norm 进行批量归一化有点棘手。现在,这是我正在使用的函数:
def batch_norm(x, phase):
return tf.contrib.layers.batch_norm(x,center = True, scale = True,
is_training = phase, updates_collections = None)
使用这个,我遵循了我在网上找到的大多数文档(还有问答),这使我得出以下结论:
1) is_training 对于训练应设置为 True,对于测试应设置为 false。这是有道理的!训练时,我收敛了(误差 < 1%,Cifar 10 数据集)。
但是在测试过程中,我的结果很糟糕(错误> 90%),除非我将(更新集合=无)作为参数添加到上面的批规范函数中。只有以此作为参数,测试才会给出我预期的错误。
我也确信使用以下内容进行培训:
update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)
with tf.control_dependencies(update_ops): # Ensures, Updating ops will perform before training
with tf.name_scope('Cross_Entropy'):
cross_entropy = tf.reduce_mean( # Implement Cross_Entropy to compute the softmax activation
tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y_conv)) # Cross Entropy: True Output Labels (y_), Softmax output (y_conv)
tf.summary.scalar('cross_entropy', cross_entropy) # Graphical output Cross Entropy
with tf.name_scope('train'):
train_step = tf.train.AdamOptimizer(1e-2).minimize(cross_entropy) # Train Network, Tensorflow minimizes cross_entropy via ADAM Optimization
with tf.name_scope('Train_Results'):
with tf.name_scope('Correct_Prediction'):
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1)) # Check if prediction is wrong with tf.equal(CNN_result,True_result)
with tf.name_scope('Accuracy'):
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) # Find the percent accuracy, take mean of correct_prediction outputs
tf.summary.scalar('accuracy', accuracy) # Graphical output Classification Accuracy
这应该确保批量归一化参数在训练期间更新。
所以这让我相信 update collections = None 只是我的批量标准化函数的一个很好的默认值,在测试过程中函数将确保不会调整任何批量标准化参数......我是对的吗?
最后:在测试阶段,打开和关闭批量标准化时获得良好结果(预期错误)是否正常?使用上面的批归一化函数,我能够很好地训练(is_training = True)和测试(is_training = False)。然而,在测试期间(is_training = True)我仍然能够获得很好的结果。这只是给我一种不好的感觉。有人可以解释为什么会发生这种情况吗?或者它是否应该发生?
感谢您的宝贵时间!
最佳答案
移动平均值
不稳定的衰减
率(默认0.999)可能是训练性能相当良好但验证/测试性能较差的原因。尝试稍低的衰减
率(0.99 或0.9)。另外,请尝试 zero_debias_moving_mean=True
以提高稳定性。
您还可以尝试不同的批量大小,看看验证性能是否有所提高。使用批量归一化时,大批量可能会破坏验证性能。请参阅this .
关于Tensorflow批量标准化: tf. contrib.layers.batch_norm,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47953242/
我对 tensorflow 中的 tf.layers.batch_normalization 感到困惑。 我的代码如下: def my_net(x, num_classes, phase_train,
我最近开始使用 Tensorflow,并一直在尽力适应环境。这真是太棒了!然而,使用 tf.contrib.layers.batch_norm 进行批量归一化有点棘手。现在,这是我正在使用的函数: d
我在 MNIST 数据上使用 Tensorflow 的官方批量归一化 (BN) 函数 ( tf.contrib.layers.batch_norm() )。我使用以下代码添加 BN: local4_b
我正在训练以下模型: with slim.arg_scope(inception_arg_scope(is_training=True)): logits_v, endpoints_v = i
对于我的实现,我必须先定义权重,并且不能在 TensorFlow 中使用高级函数,如 tf.layers.batch_normalization 或 tf.layers.dense。所以要进行批量归一
我已经在 tensorflow 中实现了某种神经网络(GAN:生成对抗网络)。 它按预期工作,直到我决定在 generator(z) 方法中添加以下批归一化层(参见下面的完整代码): out = tf
我需要在 while 循环体中添加一个 batch_normalization 层,但当我训练网络时它会崩溃。如果我删除x = tf.layers.batch_normalization(x,trai
我使用 TensorFlow 训练 DNN。我了解到 Batch Normalization 对 DNN 非常有帮助,所以我在 DNN 中使用了它。 我使用“tf.layers.batch_norma
tf.layers.batch_normalization 中“可训练”和“训练”标志的意义是什么?这两者在训练和预测过程中有何不同? 最佳答案 批量归一化有两个阶段: 1. Training:
我目前正在实现一个模型,我需要在测试期间更改运行平均值和标准偏差。因此,我假设 nn.functional.batch_norm将是比 nn.BatchNorm2d 更好的选择 但是,我有成批的图像作
我正在尝试构建一个具有两个损失函数的神经网络,它们像加权和一样组合在一起。第一个简单地计算 mean square error密集层和给定标签的线性输出,但另一个大量使用嵌套 tf.map_fn 。有
我正在将 TensorFlow 代码迁移到 TensorFlow 2.1.0。 原代码如下: conv = tf.layers.conv2d(inputs, out_channels, kernel_
我尝试在 Mnist 数据集上使用函数 tf.contrib.layers.batch_norm 实现 CNN。 当我训练和检查模型时,我发现损失正在减少(很好!),但测试数据集的准确性仍然是随机的(
我正在尝试使用 tensorflow 给出的归一化层。在那function ,有一个字段指定我们是使用 beta 还是 gamma 值。 center: If True, subtract beta.
我有一个 Keras 函数模型(具有卷积层的神经网络),它可以很好地与 tensorflow 配合使用。我可以运行它,我可以适应它。 但是,使用tensorflow gpu时无法建立模型。 这是构建模
以下代码(复制/粘贴可运行)说明了如何使用 tf.layers.batch_normalization。 import tensorflow as tf bn = tf.layers.batch_no
我是一名优秀的程序员,十分优秀!