gpt4 book ai didi

python - 如何计算只有一个输出单元的梯度?

转载 作者:行者123 更新时间:2023-12-01 06:30:48 26 4
gpt4 key购买 nike

我有一个名为net的训练模型,最后一层(输出层)是一个具有10个单元和线性激活函数的密集层。当我像这样计算梯度时,一切正常:

   with tf.GradientTape(persistent=True) as tape:
output = net(x)
grad = tape.gradient(output, x)

输出是形状为 (1, 10) 的 tf.Tensor。

现在,当我尝试仅从 10 个输出单位中的一个计算梯度时,梯度为 None,例如,我对第一个单位进行这样的计算:

   with tf.GradientTape(persistent=True) as tape:
output = net(x)
grad = tape.gradient(output[0,0], x)

输出[0,0]是一个tf.Tensor。

计算梯度的正确方法是什么?

最佳答案

实际上非常简单:您需要在磁带上下文中执行所有操作,包括索引。含义:

with tf.GradientTape(persistent=True) as tape:
output = net(x)[0, 0]
grad = tape.gradient(output, x)

这应该按预期工作。请记住,即使是像索引到张量这样的简单操作也是一个定义了梯度并且需要反向传播的“操作”。如果您在磁带上下文之外执行此操作,则磁带基本上“失去了对操作序列的跟踪”,并且无法再计算梯度。通过将索引移动到上下文中,问题就解决了。

关于python - 如何计算只有一个输出单元的梯度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59922755/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com