gpt4 book ai didi

machine-learning - 麻省理工学院深度流量挑战赛的奖励功能?

转载 作者:行者123 更新时间:2023-11-30 09:47:16 26 4
gpt4 key购买 nike

我一直在玩MIT DeepTraffic Challenge另外watching the lecture and reading the slides

在对架构有了总体了解之后,我想知道环境给出的奖励函数到底是什么。

  1. 与网格单元的输入(最大可行驶速度)相同吗?
  2. 他们是否使用奖励剪辑?

我还发现了这个javascript Codebase ,这对我的理解也没有多大帮助。

最佳答案

奖励是区间内的平均速度:[-3, 3]。

deeptraffic环境的实现位于此文件中: https://selfdrivingcars.mit.edu/deeptraffic/gameopt.js

我正在努力使其可读。这是 WIP 中的一个: https://github.com/mljack/deeptraffic/blob/master/gameopt.js

    var reward = (avgSpeedMeasurement - 60) / 20;

关于machine-learning - 麻省理工学院深度流量挑战赛的奖励功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50989406/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com