machine-learning - 层归一化层中的 beta 和 gamma 参数的形状是什么？-6ren

machine-learning - 层归一化层中的 beta 和 gamma 参数的形状是什么？

转载作者：行者123 更新时间：2023-11-30 09:04:12

25

4

在层归一化中，我们计算整个输入层的均值和方差(而不是我们在批量归一化中所做的跨批处理计算)。然后根据均值和方差对输入层进行归一化，然后返回gamma乘以归一化层加上beta。

我的问题是，gamma 和 beta 标量的形状分别为 (1, 1) 和 (1, 1)，还是它们的形状分别为 (1, 隐藏单元数) 和 (1, 隐藏单元数)。

这是我实现层标准化的方法，这是正确的吗!

def layernorm(layer, gamma, beta):
    mean = np.mean(layer, axis = 1, keepdims = True)
    variance = np.mean((layer - mean) ** 2, axis=1, keepdims = True)
    layer_hat = (layer - mean) * 1.0 / np.sqrt(variance + 1e-8)
    outpus = gamma * layer_hat + beta
    return outpus

其中 gamma 和 beta 定义如下:

gamma = np.random.normal(1, 128)
beta = np.random.normal(1, 128)

最佳答案

根据Tensorflow's implementation ，假设输入的形状为[B，rest]，gamma 和 beta 的形状为rest。 rest 对于 2 维输入可以是 (h, )，对于 4 维输入可以是 (h, w, c)。

关于machine-learning - 层归一化层中的 beta 和 gamma 参数的形状是什么？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56697941/

25

4

0

文章推荐： Javascript 数组操作

文章推荐： javascript - Backbone.js - 更改事件未触发

文章推荐： php - jQuery Ajax 发布到 php 没有捕获变量

image - Gamma 校正公式 : . ^(gamma) 还是 .^(1/gamma)？
我正在寻找一个简单的 Gamma 校正公式，适用于值在 0 到 255 之间的灰度图像。假设我的屏幕的 Gamma 值为 2.2(它是 LCD 屏幕，因此我可能需要使用更复杂的过程来估计它，但我们假
opencv - 如何估算用于 Gamma 校正的最佳 Gamma 参数？
是否可以通过使用某些图像统计信息的算法来估算gamma correction的最佳 Gamma 参数？所谓“最佳”，是指校正后的图像平均应该对人类“看起来不错”。最佳答案如果图像像素的缩放比例在0
r - Gamma 障碍(两部分)模型和零膨胀 Gamma 模型之间有区别吗？
我有我正在尝试建模的半连续数据(许多精确的零和连续的正结果)。我从 Zuur 和 Ieno 的 R 中零膨胀模型初学者指南中学到了大量关于零质量的建模数据，它区分了零膨胀 Gamma 模型和他们所描述
python - 计算 Gamma(x+1/2)/Gamma(x)
我需要为相当大的 x 计算 Gamma(x+1/2)/Gamma(x)。如果我只使用 http://docs.scipy.org/doc/scipy/reference/generated/scipy
c++ - C 或 C 中的 gamma 或 log gamma 函数
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的，
python-3.x - 在 tensorflow 中获取随机 Gamma 分布，如 numpy.random.gamma
嗨，我是 tensorflow 的新手，我正在尝试在 tensorflow 中生成随机 Gamma 分布，就像 numpy.random.gamma 我的 numpy 代码是:- self._lamb
RcppArmadillo Gamma 分布在具有相同种子的平台之间不同
我正在研究 a package ，它使用来自 RcppArmadillo 的随机数。该软件包运行 MCMC 算法，为了获得精确的再现性，用户应该能够设置随机数种子。执行此操作时，似乎用于从 Gamma
R - Gamma 累积分布函数
我想计算我拥有的一组数据的 Gamma CDF。我已经计算了 alpha 和 beta 参数，但是我不确定如何在 R 中计算 CDF(是否有类似 Matlab 的 gamcdf 的东西？)。我看到有
fortran - GAMMA 的结果低于同类
我想使用以下程序计算 gamma(-170.1): program arithmetic ! program to do a calculation real(8) :: x x = GAMMA
R - Gamma 累积分布函数
我想计算我拥有的一组数据的 Gamma CDF。我已经计算了 alpha 和 beta 参数，但是我不确定如何在 R 中计算 CDF(是否有类似 Matlab 的 gamcdf 的东西？)。我看到有
Python转换 Gamma 分布的x轴单位
我有一个形状和尺度参数为 2.126、0.370 的 Gamma 分布。您可以使用以下代码绘制它: shape, scale = 2.126, 0.370 # mean=4, std=2*sqrt
python - Gamma 回归仅截距
我是 python 的新手，我正在尝试进行 Gamma 回归，我希望获得与 R 类似的估计，但我无法理解 python 的语法并且它会产生错误，关于如何解决它的一些想法。我的 R 代码: set.s
algorithm - 通过跳过级别确定图像 Gamma
有很多扫描仪允许在它们的设置中设置图像 Gamma ，但不幸的是，这个 Gamma 是在扫描仪软件中调整的，而不是在扫描仪端(通过模拟方式或至少使用分辨率高于 8 位的 ADC) .比如说，我们最初从
Java - Gamma 算法
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
c# - 调整图像的亮度对比度和 Gamma
在 .NET 中调整图像的亮度对比度和 Gamma 值的简单方法是什么我会自己发布答案以供稍后查找。最佳答案 c# and gdi+ have a simple way to control th
java - 如何使我的阶乘方法适用于小数？ ( Gamma )
我有一个方法可以返回输入的阶乘。它非常适用于整数，但我不知道如何让它适用于小数。目前我的方法是这样的: public static double factorial(double d) {
r - 具有 Gamma 参数的渐变色标？
我有一些对比度非常微弱且有相当多噪点的成像数据，当我使用线性色标显示时，显示效果不佳。在 imageJ 或 photoshop 等成像软件中，有一条色调曲线，可以对其进行调整以非线性方式增强对比度，并
R xgboost， Gamma 回归问题
我正在玩 xgboost，有一些财务数据，想尝试 Gamma 回归作为目标。 cvs 根据 xgboost 文档，stratified 是一个 bool 值，指示是否应根据结果标签的值对折叠采样进行
opengl - 什么是正确的 Gamma 校正函数？
目前，我使用以下公式在光照通过后对颜色进行 Gamma 校正(将它们从 RGB 颜色空间转换为 sRGB 颜色空间): output = pow(color, vec3(1.0/2.2)); 这个公式
python - python中的 Gamma 分布
我们有qgamma在 R 和 gamm.inv在 excel 中，我无法使用 invgamma 获得相同的结果python中的函数。例如在excel中GAMMA.INV(0.99,35,0.08)=4

首页

博学

6Ren·AI

商城

machine-learning - 层归一化层中的 beta 和 gamma 参数的形状是什么？