- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试实现资格跟踪(前瞻性),其伪代码可以在下图中找到
我不确定 For all s, a
的含义(从下面第 5 行)。他们从哪里获得 s, a
的集合?
如果是前瞻性的,是否从当前状态向前循环观察s'
?
你会调整每一个e(s, a)
吗?
最佳答案
不幸的是,他们在两个不同的范围内重用了变量 s 和 a,但是,是的,您可以调整所有 e(s,a) 值,例如,
for every state s in your state space
for every action a in your action space
update Q(s,a)
update e(s,a)
注意这里发生了什么。 e(s,a) 以指数递减的方式递增。但就在进入该循环之前,您增加了与刚刚访问的状态/操作对相对应的single e(s,a)。因此,该对以某种方式“重置”——它不会获得指数较小的更新,并且在下一次迭代中,它的更新将继续大于您最近未访问过的所有对。每次访问状态/操作对时,都会增加它对 Q 的更新贡献的权重,进行几次迭代。
关于machine-learning - SARSA 的资格痕迹是如何计算的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23559050/
我希望递归地清除 SVN,但当然保留我的文件。 最佳答案 你的意思是杀死所有的 .svn 目录?应该这样做: find -name '.svn' -type d -exec rm -rf {} ';'
有没有Fody的痕迹,或其依赖项(引用),在最终编织的程序集中? 最佳答案 所以这真的应该是几个问题 Fody 是否在最终组装中留下任何引用资料? No Fody 不需要任何引用,也不会在 ILWea
这个问题在这里已经有了答案: Do a "git export" (like "svn export")? (31 个答案) How do I remove version tracking fro
我有一些 Clojure 代码正在模拟然后处理数值数据。数据基本上是双值向量;处理主要涉及以各种方式对它们的值进行求和。我将在下面包含一些代码,但我的问题(我认为)更笼统 - 我只是不知道如何解释 h
我正在制作一个 Cocoa 应用程序,使用 Core Animation 来创建自定义 UI。然而,每当我拖动一些图层时,它们通常会在其他图层上留下一些“残留物/痕迹”。 到目前为止,我的猜测是这与我
我正在构建一个应用程序,允许用户使用 selectInput 在绘图图上动态添加和删除跟踪。 我试图从 plotly 包中使用 plotlyProxy () 和 plotlyProxyInvoke (
我一直在尝试使用 jquery 创建一种效果,当您将鼠标移到一个 div 上时,整个 body 都会移动,并沿着它经过的点留下一条轨迹。我创建了一个可以使整个 body 移动的功能,但我找不到离开轨迹
我试图让 NSClipView 绘制清晰的背景(将颜色设置为清除黑框中的结果),或者根本不绘制背景。不绘制背景会导致重影伪影。不管怎样,要让它在没有伪影的情况下绘制没有背景的??? NSClipVie
我尝试在 SPARK 集群上运行 Python 脚本,出现错误 File "create_csv_ecs.py", line 15, in sc = SparkContext(conf=conf)
我是一名优秀的程序员,十分优秀!