作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
给定经过训练的上下文老虎机模型,如何检索测试样本的预测向量?
例如,假设我有一个名为“train.dat”的火车集,其中包含格式如下的行
1:-1:0.3 | a b c # <action:cost:probability | features>
2:2:0.3 | a d d
3:-1:0.3 | a b e
....
vw -d train.dat --cb 30 -f cb.model --save_resume
| a d d
| a b e
0.2 0.7 0.1
最佳答案
当您使用“--cb K”时,预测是基于 argmax 策略的最佳 ARM / Action ,这是一个静态策略。
使用“--cb_explore K”时,预测输出包含每个 ARM / Action 的概率。根据您选择的策略,概率的计算方式不同。
关于vowpalwabbit - Vowpal Wabbit - 如何从测试样本的上下文老虎机模型中获得预测概率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41669363/
代码运行良好。然而有一个小问题,如果后两个数字相同,则代码表示没有数字匹配。例如: 0 2 2没有匹配的数字再玩一次? (是/否?) 显然应该说: 0 2 2两个数字匹配再玩一次? (是/否?) 如何
我是一名 Python 新手,正在尝试创建一个模拟真机支出的老虎机模拟器。我在计算线路支出时遇到了问题,我确信有一种更智能的方法可以遍历线路并计算它们。 定义一些我将要使用的常量: SymbolMap
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
我是一名优秀的程序员,十分优秀!