gpt4 book ai didi

python - 在 tensorflow 中使用负损失

转载 作者:行者123 更新时间:2023-11-30 09:34:03 27 4
gpt4 key购买 nike

我正在实现一个基于类采取行动的强化代理。所以它可以采取行动 1 或 2 或 3 或 4。

所以我的问题是我可以在 tensorflow 中使用负损失来阻止它输出 Action 。

示例:假设代理输出 Action 1,我想非常强烈地阻止它在这种情况下再次采取 Action 1。但没有已知的应该采取的行动。所以我不能只是选择不同的 Action 来让它学习这一点。

所以我的问题是: tensorflow 梯度计算是否处理负值损失。如果确实如此,它会按照我描述的方式工作吗?

最佳答案

梯度下降最小化器通常会尝试找到最小损失,而不管损失表面的符号如何。听起来您要么想要a)指定一个大损失以鼓励您的模型选择其他内容,要么b)指定第五个不采取行动 类别。

关于python - 在 tensorflow 中使用负损失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48140133/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com