gpt4 book ai didi

vowpalwabbit - Vowpal Wabbit 公式中的自适应更新

转载 作者:行者123 更新时间:2023-12-02 01:41:14 28 4
gpt4 key购买 nike

我正在查看以下 2 个关于 VW 在使用 --adaptive 标志时所做的更新的演示。 似乎它们是不同的。

  1. http://www.slideshare.net/jakehofman/technical-tricks-of-vowpal-wabbit
  2. https://github.com/JohnLangford/vowpal_wabbit/wiki/v6.1_tutorial.pdf

有了这两个描述(分别):

#1

enter image description here

#2

enter image description here

我的问题:

  1. 哪些是正确的(或者相同)?

  2. 对于数字 1,分母中似乎使用了 t+1 示例中的梯度。这是怎么做到的?这是否意味着新权重(标记为 w_i)是例如 t+1 的权重?

最佳答案

如您所见,first presentation AdaGrad 公式中包含错误/拼写错误。公式should be w_{i, t+1} := w_{i, t} - (\eta * g_{i, t}/\sqrt{sum}),其中sum=\sum_{t'=1}^t g_{我,t'}^2.

在VowpalWabbit中,--adaptive(对应AdaGrad思想)默认开启。但是 --normalized--invariant 也是默认开启的,这意味着在普通的 AdaGrad 之上应用了一些技巧/改进。所有这些技巧的交互都很复杂,没有一张幻灯片可以描述所有方面,所以唯一的引用是源代码 ( gd.cc )。

Which of these are correct (or are they the same)?

我认为它们并不相同,但它们是复杂代码的不同“层”。我认为 second presentation 的幻灯片 33(您将其引用为 #2)对应于幻灯片 31(你没有引用) first presentation , 但我不确定。

关于vowpalwabbit - Vowpal Wabbit 公式中的自适应更新,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28528614/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com