- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在学习“深度强化学习”,并在学习了 pytorch 的强化学习 (DQN) 教程之后构建了自己的示例。
我按如下方式实现 Actor 的策略:1. 模型.eval()2. 从模型中获得最佳 Action 3. self.net.train()
问题是:在 eval() 和 train() 模式之间来回切换是否会对优化过程造成任何损害?
该模型仅包含 Linear 和 BatchNorm1d 层。据我所知,在使用 BatchNorm1d 时必须执行 model.eval() 才能使用模型,因为 eval() 和 train() 模式的结果不同。
训练分类神经网络时,model.eval() 仅在训练完成后执行,但在“深度强化学习”的情况下,通常使用策略,然后继续优化过程。
我想知道在模式之间来回切换是否对优化过程“无害”?
def strategy(self, state):
# Explore or Exploit
if self.epsilon > random():
action = choice(self.actions)
else:
self.net.eval()
action = self.net(state.unsqueeze(0)).max(1)[1].detach()
self.net.train()
最佳答案
eval()
将模型置于评估模式。
在评估模式下,Dropout 层只是充当“直通”层。
在训练期间,BatchNorm
层对其计算的均值和方差进行运行估计。运行总和保持默认动量 0.1。在评估期间,此运行均值/方差用于归一化。
因此,在 eval()
和 train()
模式之间来回切换不会对优化过程造成任何损害。
关于python - Pytorch - 在 eval() 和 train() 模式之间来回切换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58447885/
我正在编写两个程序,一个用 C++ 编写,另一个用 Python 编写,以使用 unix 域套接字相互通信。我想做的是让 C++ 代码向 Python 代码发送一个数字,Python 代码又将另一个数
我希望有一个生成器函数,它返回一条线上的点,给定一个最小距离 k。这很简单,可以使用 numpy 完成,如下所示: points = np.linspace(start, end, k) 但是,我想生
根据我的理解,我们一直在用 Git 做一个非常标准的分支模型的项目,描述如下:http://nvie.com/posts/a-successful-git-branching-model/ 我们从“m
我有一张图片,我想单击它以动画形式旋转 90 度,当它再次单击时我希望它以动画形式旋转 -90 度。 对于使用 css3 变换的旋转 im: -moz-transform:rotate(90deg);
我正在尝试将 拖放 Logo 到 2 个 SVG 圆圈 中。在我的代码的帮助下,图像被拖到一个圆圈中,但没有被拖到另一个圆圈中。 如何修改code这样图像可以在两个圆圈之间拖/放? function
我正在使用 python 3.5.2、pandas 0.18.1 和 sqlite3。 在我的数据库中,我有一个列 unix_time 和 INT 自 1970 年以来的秒数。理想情况下我想从 sql
我已经在我的服务器上安装了 SSL。我的问题是如何通过 acegi 插件在选定的 Controller /页面上强制使用 https。 Acegi 插件支持一个属性 forcehttps,当设置为 t
这是我第一次发布查询。我需要帮助。感谢您的帮助。 我同意我已经把我的概率作为一个长篇故事。但很抱歉,我不知道如何缩短它,我的目的是提供有关我的问题的完整信息。 问题:我必须在 Windows 平台上使
我是一名优秀的程序员,十分优秀!