gpt4 book ai didi

machine-learning - 在强化学习中,当 Action 不影响状态时,它被称为什么?

转载 作者:行者123 更新时间:2023-11-30 08:52:04 24 4
gpt4 key购买 nike

在强化学习中,是否有一个算法名称,其中所采取的操作不会影响状态?例如武装强盗

最佳答案

在 RL 设置中,armed bandits被认为是无状态的,因此 Action 自然不会影响状态。只有行动和奖励。

如果您添加一个状态,但操作不会影响下一个状态,则它们被称为 Contextual Bandits 。上下文强盗有状态、 Action 和奖励。您的状态(或“上下文”)可能会影响您的操作,但反之则不然,即没有像普通 RL 那样的转换规则。

关于machine-learning - 在强化学习中,当 Action 不影响状态时,它被称为什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50421014/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com