vowpalwabbit - Vowpal Wabbit - 如何从测试样本的上下文老虎机模型中获得预测概率-6ren

vowpalwabbit - Vowpal Wabbit - 如何从测试样本的上下文老虎机模型中获得预测概率

转载作者：行者123 更新时间：2023-12-04 04:11:24

给定经过训练的上下文老虎机模型，如何检索测试样本的预测向量？

例如，假设我有一个名为“train.dat”的火车集，其中包含格式如下的行

1:-1:0.3 | a b c  # <action:cost:probability | features> 
2:2:0.3 | a d d 
3:-1:0.3 | a b e
....

我在命令下运行。

vw -d train.dat --cb 30 -f cb.model --save_resume

这会生成一个文件“cb.model”。现在，假设我有一个如下的测试数据集

| a d d 
| a b e

我想看到概率如下

0.2 0.7 0.1

这些概率的解释是行动 1 应该在 20% 的时间内被选择，行动 2 - 70% 和行动 3 - 10% 的时间。

有没有办法得到这样的东西？

最佳答案

当您使用“--cb K”时，预测是基于 argmax 策略的最佳 ARM / Action ，这是一个静态策略。

使用“--cb_explore K”时，预测输出包含每个 ARM / Action 的概率。根据您选择的策略，概率的计算方式不同。

关于vowpalwabbit - Vowpal Wabbit - 如何从测试样本的上下文老虎机模型中获得预测概率，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41669363/

java - 老虎机 - 输出不正确
代码运行良好。然而有一个小问题，如果后两个数字相同，则代码表示没有数字匹配。例如: 0 2 2没有匹配的数字再玩一次？ (是/否？) 显然应该说: 0 2 2两个数字匹配再玩一次？ (是/否？) 如何
python 老虎机 : Calculating Line Payouts
我是一名 Python 新手，正在尝试创建一个模拟真机支出的老虎机模拟器。我在计算线路支出时遇到了问题，我确信有一种更智能的方法可以遍历线路并计算它们。定义一些我将要使用的常量: SymbolMap
javascript - 类似 iPhone 的(老虎机) 'picker' 网络选择框？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章