- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
对于我的实现,我必须先定义权重,并且不能在 TensorFlow 中使用高级函数,如 tf.layers.batch_normalization 或 tf.layers.dense。所以要进行批量归一化,我需要使用 tf.nn.batch_normalization。我知道为了计算每个小批量的均值和方差我可以使用 tf.nn.moments,但是移动均值和方差呢?有没有人有这样做的经验或知道实现的例子?我看到人们谈论使用 tf.nn.batch_normalization 可能很棘手,所以我想知道这样做的复杂性。换句话说,是什么让它变得棘手,在实现过程中我应该注意哪些要点?除了移动平均线和方差之外,还有什么我应该注意的吗?
最佳答案
您必须警惕术语 running_mean
和 running_variance
。在数学和传统的计算机科学中,它们被称为在没有看到完整数据的情况下计算这些值的方法。它们也称为 mean
和 variance
的在线
版本。并不是说他们能够事先准确地确定 mean
和 variance
。他们只是不断更新一些变量 mean
和 variance
的值,因为有更多的数据进来。如果你的数据大小是有限的,那么一旦看到完整的数据,他们的如果完整数据可用,值将与计算值相匹配。
batch normalization的情况不同。您不应以与上一段相同的方式来考虑running mean
和running variance
。
训练时间
在训练期间,mean
和variance
是为batch
计算的。它们不是运行均值
或运行方差
。因此,您可以安全地使用 tf.nn.moments
来做到这一点。
测试时间
在测试期间,您使用的应该称为 population_estimated_mean
和 population_estimated_variance
。这些量是在训练期间计算的,但不会直接使用。计算它们以供以后在测试期间使用。
现在的一个陷阱是,有些人可能想使用 Knuth 公式
来计算这些量。这是不可取的。 <强>为什么? : 因为,训练是在几个 epoch
上完成的。因此,同一数据集出现的次数与 epochs
的次数一样多。由于数据扩充通常也是随机的,因此计算标准的运行均值
和运行方差
可能很危险。相反,通常使用的是指数衰减估计
。
您可以通过在 batch_mean
和 batch_variance
上使用 tf.train.ExponentialMovingAverage
来实现这一点。在这里,您指定过去样本相对于当前样本的相关性。通过设置 trainable=False
,确保您用于计算的变量应该是 不可训练的
。
在测试期间,您将使用这些变量作为mean
和variance
。
有关实现的更多详细信息,您可以查看 this link .
关于python - 如何使用 tf.nn.batch_normalization 处理移动均值和移动方差?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52333905/
在 Tensorflow(从 v1.2.1 开始)中,似乎有(至少)两个并行 API 来构建计算图。 tf.nn 中有函数,如 conv2d、avg_pool、relu、dropout,tf.laye
我正在处理眼睛轨迹数据和卷积神经网络。我被要求使用 tf.reduce_max(lastconv, axis=2)代替 MaxPooling 层和 tf.reduce_sum(lastconv,axi
TensorFlow 提供了 3 种不同的数据存储格式 tf.train.Feature .它们是: tf.train.BytesList tf.train.FloatList tf.train.In
我正在尝试为上下文强盗问题 (https://medium.com/emergent-future/simple-reinforcement-learning-with-tensorflow-part
我在使用 Tensorflow 时遇到问题: 以下代码为卷积 block 生成正确的图: def conv_layer(self, inputs, filter_size = 3, num_filte
我正在将我的训练循环迁移到 Tensorflow 2.0 API .在急切执行模式下,tf.GradientTape替换 tf.gradients .问题是,它们是否具有相同的功能?具体来说: 在函数
tensorflow 中 tf.control_dependencies(tf.get_collection(tf.GraphKeys.UPDATE_OPS)) 的目的是什么? 更多上下文:
我一直在努力学习 TensorFlow,我注意到不同的函数用于相同的目标。例如,为了平方变量,我看到了 tf.square()、tf.math.square() 和 tf.keras.backend.
我正在尝试使用自动编码器开发图像着色器。有 13000 张训练图像。如果我使用 tf.data,每个 epoch 大约需要 45 分钟,如果我使用 tf.utils.keras.Sequence 大约
我尝试按照 tensorflow 教程实现 MNIST CNN 神经网络,并找到这些实现 softmax 交叉熵的方法给出了不同的结果: (1) 不好的结果 softmax = tf.nn.softm
其实,我正在coursera上做deeplearning.ai的作业“Art Generation with Neural Style Transfer”。在函数 compute_layer_styl
训练神经网络学习“异或” 我正在尝试使用“批量归一化”,我创建了一个批量归一化层函数“batch_norm1”。 import tensorflow as tf import nump
我正在尝试协调来自 TF“图形和 session ”指南以及 TF“Keras”指南和 TF Estimators 指南的信息。现在在前者中它说 tf.Session 使计算图能够访问物理硬件以执行图
我正在关注此处的多层感知器示例:https://github.com/aymericdamien/TensorFlow-Examples我对函数 tf.nn.softmax_cross_entropy
回到 TensorFlow = 2.0 中消失了。因此,像这样的解决方案...... with tf.variable_scope("foo"): with tf.variable_scope
我按照官方网站中的步骤安装了tensorflow。但是,在该网站中,作为安装的最后一步,他们给出了一行代码来“验证安装”。但他们没有告诉这段代码会给出什么输出。 该行是: python -c "imp
代码: x = tf.constant([1.,2.,3.], shape = (3,2,4)) y = tf.constant([1.,2.,3.], shape = (3,21,4)) tf.ma
我正在尝试从 Github 训练一个 3D 分割网络.我的模型是用 Keras (Python) 实现的,这是一个典型的 U-Net 模型。模型,总结如下, Model: "functional_3"
我正在使用 TensorFlow 2。我正在尝试优化一个函数,该函数使用经过训练的 tensorflow 模型(毒药)的损失。 @tf.function def totalloss(x): x
试图了解 keras 优化器中的 SGD 优化代码 (source code)。在 get_updates 模块中,我们有: # momentum shapes = [K.int_shape(p) f
我是一名优秀的程序员,十分优秀!