machine-learning - 概率分布中的 argmax 比 softmax 中的随机采样更好的策略？-6ren

machine-learning - 概率分布中的 argmax 比 softmax 中的随机采样更好的策略？

转载作者：行者123 更新时间：2023-11-30 09:31:29

24

4

我正在尝试按照强化学习的方式训练回声状态网络以进行文本生成，并进行随机优化，其中优化取决于奖励信号。

我观察到，在评估过程中，当我从概率分布中采样时，bleu 分数比我从分布中采样 argmax 时的分数更大。差异几乎超过 0.10 分(BLEU 分数一般在 0 和 1 范围之间)。我不知道为什么会发生这种情况。需要帮助。

最佳答案

您不使用 argmax 函数，因为它是一种确定性方法。这样做的主要问题是它很容易让你陷入循环。这意味着，如果文本生成中出现错误，您可能会继续沿着这条路走下去，而没有任何可能退出。随机性允许“跳出”循环。

页面排名算法是说明这种跳出需求的一个很好的例子。它使用随机游走参数，允许假想的冲浪者走出死胡同。

TensorFlow 团队在他们的教程中谈到了这一点(没有任何理由):

Note: It is important to sample from this distribution as taking the argmax of the distribution can easily get the model stuck in a loop.

关于machine-learning - 概率分布中的 argmax 比 softmax 中的随机采样更好的策略？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/55963251/

24

4

0

文章推荐： javascript - 只打印偶数

文章推荐： java - Hibernate 通过 id 更改属性实例

文章推荐： javascript - Node.js 最大安全 float

文章推荐： javascript - jQuery 滑动切换在双击时触发两次

python - numpy 数组 - unravel_index of argmax v. argmax of sum
我试图沿一个轴边缘化数组，并检查一维峰值是否出现在与原始二维峰值相同的相关索引处。在什么情况下(x 的形式)以下断言会失败？ def check(x,axis=None): import nu
c++ - 为什么有一个用于 argmax abs 的 blas 子例程 (ISAMAX) 而没有用于 argmax？
为什么会有一个blas子程序 ISAMAX适用于 argmax abs 但不适用于 argmax ？在 C++ 中使用 std::max_element使用编译器优化标志 -O3 我得到的速度与 b
python - TensorFlow Tensor 在 numpy argmax 与 keras argmax 中的处理方式不同
为什么 TensorFlow 张量在 Numpy 中的数学函数中的行为与在 Keras 中的数学函数中的行为不同？ Numpy 数组在与 TensorFlow Tensor 相同的情况下似乎表现正常。
python - `Pandas argmax` 在屏蔽后获取所有 `True` 索引(Python 3)(例如 (pd.Series > 0).argmax()))
我想要做什么，但 argmax 只给我第一个值为 True 的值: Se = pd.Series(np.arange(6), index=list("abcdef")) #a 0 #b 1
numpy argmax 没有从生成器表达式中获取所有值
下面的输出 import numpy as np print(np.argmax([i for i in range(0, 10)])) print(np.argmax(i for i in rang
arrays - 多维np.argmax？
我有一个形状为 (n, n, g) 的 3D 数组，我需要每个 (n, n) argmax，即结果应该是两个长度为 g 的索引向量 (x, y)。直观的解决方案是: array = np.rando
python - argmax 用于沿某个轴的多维数组
我有一个如下所示的多维数组: my_array = np.arange(2)[:,None,None] *np.arange(4)[:, None]*np.arange(8) 我正在寻找二维 argm
python - 如何自己实现tf.argmax？
我想使用一个函数，该函数将张量作为输入并返回张量各轴上最大值的索引。我知道存在一个函数 tf.argmax() 具有完全相同的功能，但是我如何自己实现它(在实现某些自定义函数时这可能是必要的)？现在
python - 了解 argmax
假设我有矩阵 import numpy as np A = np.matrix([[1,2,3,33],[4,5,6,66],[7,8,9,99]]) 我试图理解函数 argmax，据我所知它返
python中的np.argmax() 返回最大值索引号
看代码吧~ ? 1
python - 返回元组的 np.argmax
我有一个形状为(n, m, s) 的矩阵A。在第 0 个轴的每个位置，我需要对应于 (m, s) 形数组中最大值的位置。例如: np.random.seed(1) A = np.random.ran
Tensorflow : tf. argmax() 作为预测还是最大值？
我正在学习 tensorflow，在各种示例中，我已经看到我们使用 tf.argmax(logits, 1) 从 logits 中获得预测.据我了解logits是概率值和 tf.argmax()会给索
javascript - 在二维数组中查找 argmax 的最快方法
JavaScript 对我来说远不是一种熟悉的语言。我有一个逻辑，我正在尝试优化速度。它包括找到二维数组(矩形)的 argmax、行和列索引。目前，我有一个天真的实现 function argMax2
python - tf.argmax() 返回意外结果
我最近正在制作一个基于 TensorFlow CNN、MNIST 数据集和服务器接口(interface)的项目。在预测部分，我使用tf.argmax()来获取最大的logit，这将是预测值。但是，
python - 如何在列表数组上使用 np argmax？
我有一些数据y_hat，看起来像: [[0. 1. 0. ... 0. 0. 0.] [0. 1. 0. ... 0. 0. 0.] [0. 1. 0. ... 0. 0. 0.] ... [
python - torch.argmax() 无法在包含数据的张量中找到最大值
我有一个形状为 [batch_size, channel, depth, height, width] 的张量: torch.Size([1, 1, 32, 64, 64]) 数据: tensor([
tensorflow - 如何使用 tf.argmax
我想测试tf.argmax()的功能，但是当我运行代码时，遇到了错误。这是我的代码 import tensorflow as tf a=tf.argmax([1,0,0],1) with tf.Se
python - 二维矩阵中某个轴上的 Numpy.argmax()
我目前正致力于创建一种排名算法来对学生之间的关系进行排名。在我的 NxN 矩阵 F 中: F[i, j] 指的是学生 i 和学生 j 之间的关系。值越高，关系越强。我的问题是这样的。为了创建一个由
python - 值相等时的 numpy argmax
我有一个 numpy 矩阵，我想获取每一行中最大值的索引。例如 [[1,2,3],[1,3,2],[3,2,1]] 会回来 [0,1,2] 但是，当每行中的最大值超过 1 个时，numpy.argma
python - numpy argmax 如何工作？
所以我知道 numpy argmax 沿轴检索最大值。因此， x = np.array([[12,11,10,9],[16,15,14,13],[20,19,18,17]]) print(x) pri

首页

博学

6Ren·AI

商城

machine-learning - 概率分布中的 argmax 比 softmax 中的随机采样更好的策略？