gpt4 book ai didi

tensorflow - 如何使用 tensorflow.Estimator 进行强化学习

转载 作者:行者123 更新时间:2023-12-04 21:04:43 24 4
gpt4 key购买 nike

tensorflow.Estimator似乎面向监督学习,但似乎很难用于其他任务,即使模型或训练只需要很小的变化。例如,在强化学习中,我需要提供一个不属于 features 的奖励值。 .

最佳答案

估计器用于古老的监督学习。因此,将它们用于强化学习可能会让人感到尴尬。这是一个可能有用的 RL 库:https://github.com/tensorflow/agents .

关于tensorflow - 如何使用 tensorflow.Estimator 进行强化学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49280634/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com