gpt4 book ai didi

machine-learning - 具有 2D Action 和 2D 状态的 Q 学习

转载 作者:行者123 更新时间:2023-11-30 09:53:30 24 4
gpt4 key购买 nike

我的问题如下:

代理应在每个状态下调节发电厂锅炉的水流量和风扇速度,以接收双重状态的反馈:当前温度、排放量。

如果我的代理有一个 Action 元组和一个状态元组,这是否意味着我应该将我的 q 学习问题分成 2 个,其中 1 个代理将具有用于水/温度环境的 Q 和 R 矩阵,另一个代理将具有用于水/温度环境的 Q 和 R 矩阵对于风扇速度/排放量环境?或者有没有办法表示最初描述的代理的 R 和 Q 矩阵?

最佳答案

状态和 Action 是多维的是正常的。您要做的就是让您的代理了解当前温度和排放量的所有组合的水流量和风扇速度的所有组合的值。如果这使得表格变得笨拙,那么您将需要对其进行近似,而这本身就是一个完整的字段。

关于machine-learning - 具有 2D Action 和 2D 状态的 Q 学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40115282/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com