machine-learning - 反转 dropout 如何补偿 dropout 的影响并保持期望值不变？-6ren

machine-learning - 反转 dropout 如何补偿 dropout 的影响并保持期望值不变？

转载作者：行者123 更新时间：2023-12-03 14:01:04

26

4

我正在从 deeplearning.ai 学习神经网络中的正则化类(class)。在 dropout 正则化中，教授说如果应用 dropout，计算的激活值将小于未应用 dropout 时(测试时)。所以我们需要扩展激活以保持测试阶段更简单。

我明白这个事实，但我不明白缩放是如何完成的。这是一个用于实现反向 dropout 的代码示例。

keep_prob = 0.8   # 0 <= keep_prob <= 1
l = 3  # this code is only for layer 3
# the generated number that are less than 0.8 will be dropped. 80% stay, 20% dropped
d3 = np.random.rand(a[l].shape[0], a[l].shape[1]) < keep_prob

a3 = np.multiply(a3,d3)   # keep only the values in d3

# increase a3 to not reduce the expected value of output
# (ensures that the expected value of a3 remains the same) - to solve the scaling problem
a3 = a3 / keep_prob

在上面的代码中，为什么激活被除以 0.8或将节点保留在层中的概率( keep_prob )？任何数字示例都会有所帮助。

最佳答案

在花了一些时间了解倒退辍学后，我自己得到了答案。这是直觉:

我们以概率 keep_prob 保留任何层中的神经元.比方说 kepp_prob = 0.6 .这意味着关闭任何层中 40% 的神经元。如果在关闭 40% 的神经元之前该层的原始输出是 x ，然后在应用 40% dropout 后，它将是 减少了 0.4 * x .所以现在是 x - 0.4x = 0.6x .

为了保持原始输出(期望值)，我们需要将输出除以 keep_prob (或 0.6 在这里)。

关于machine-learning - 反转 dropout 如何补偿 dropout 的影响并保持期望值不变？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57193633/

26

4

0

文章推荐： wpf - 为什么我的 Grid 的宽度是 NaN？

文章推荐： macos - 复制/粘贴 - 从 Mac 到虚拟机

文章推荐： amazon-web-services - NAT 网关是否需要 Internet 网关？

MPEG1运动估计/补偿
我看到以下关于 MPEG 1 运动估计/补偿的解释，只是想知道它是否正确: 为什么我们不直接编码当前 block 和引用 block 之间的原始差异？因为残差的数字通常会小很多。例如，假设一个物体在图
graphics - 抗锯齿和 Gamma 补偿
计算机屏幕上像素的亮度通常与像素的数字 RGB 三元组值不线性相关。早期 CRT 的非线性响应需要补偿非线性编码，我们今天仍在继续使用此类编码。通常我们在计算机屏幕上生成图像并在那里使用它们，所以一
iphone - 补偿 iPhone 顶部的状态栏
我不知道它叫什么。状态栏？随着接待和电池生命周期的增加。但是有没有一种简单的方法可以判断它是否显示在应用程序中？我正在编写一些通用代码，如果没有栏，我希望将某些内容放置在屏幕顶部，如果有，则在栏下方
css - 补偿 Safari 的边框半径绘图
观察下面的简单示例: div { border-bottom: 1px solid black; border-radius: 20%; padding: 10px; } Test 在 S
ios - 补偿 AVLayerVideoGravityResizeAspectFill 高度差
我有一个这样的嵌套视频: Live camera feed 当用户拍照时，图像沿y轴偏移 Captured Still image 我确实想要捕获整个图像并让用户上下滚动。他们目前可以这样做，但我希望
css - 调整/补偿 CSS 中奇怪的字体行高
我从客户端收到了一个字体 (Calibre) 作为 OTF 文件，用于网络应用程序，但文件的“行高”(或者你怎么调用它？)有些奇怪。实际文本溢出顶部的 dom 元素并在下面留下一堆空间，导致各种丑陋。
c++ - 补偿 double/float 不准确
我编写了一个数学计算器，它从用户那里接收一个字符串并对其进行解析。它使用 double 来保存计算时涉及的所有值。解决后，我将其打印出来，并使用 std::setprecision() 确保其输出正确
android - 补偿 Android 设备的差异？ (视频游戏编程)
不同的 Android 设备具有不同的屏幕尺寸和屏幕密度。编写视频游戏时，补偿差异的好方法是什么？最佳答案我们先从 Android 的文档开始 Supporting Multiple Screen
javascript - 如何计算元素旋转的变换平移(x，y)补偿？
我正在制作个人资料图片裁剪编辑器，它允许在区域内拖动、缩放和旋转图像。图片的拖动是通过捕捉区域的mousedown和mousemove事件，计算区域内游标开始和停止的x/y坐标，得到游标移动的距离。
java - AnyLogic:补偿 GISRegion.area() 中的双重溢出
我正在尝试按地理区域对 AnyLogic GISRegions 集合进行排序。所述面积是使用GISRegion.area(units)计算的，这很简单。然而，我使用的区域是城市规模的，并且该方法返回一
javascript - 补偿 Moment.js 中的 utcOffset
首先，我希望这不是重复的。我读过很多类似的问题，但找不到与此特定问题相关的问题。我有一个 javascript 日期选择器，它在内部使用 javascript 日期，这会产生意想不到的副作用。当我选
css - 补偿 margin : 0 auto in IE
您可以在此处查看实时版本:http://steffiwilson.com/test . IE9 没有将内容 block 居中。 (我很确定旧版本的 IE 也不能正常工作，但我不能肯定地说。)我已经确保

首页

博学

6Ren·AI

商城

machine-learning - 反转 dropout 如何补偿 dropout 的影响并保持期望值不变？