gpt4 book ai didi

machine-learning - 如何用神经网络实现寻路和拥塞检测?

转载 作者:行者123 更新时间:2023-11-30 09:54:54 30 4
gpt4 key购买 nike

Conveyor layout. A and B entry points and C and D exit points. There is a crossroad at position X

这是一个传送系统。盒子从 A 处进入系统,然后移向 C 处,从 C 处退出系统。 B->D 也是如此。

路径 A->C 上的框比框 B->D 具有更高的优先级。箱子可以在每个方格停下来等待。如果A2上和B2上都有一个盒子,则A2上的盒子应该先经过X。

如果C2、C1、A2和B2上都有盒子,那么来自B2的盒子应该经过X,而A2上的盒子应该等待,直到C1为空。否则会阻塞 B->D 的路径。

如何使用神经网络解决这个问题?因此,对于每一回合,我都想输入每个 block 的当前状态,因此我想从哪里移动到下一个盒子应该移动的地方。

例如:系统状态:BOX 位于 A1结果:A1、A2

我不知道神经网络是否是解决这个问题的好工具,但我只是好奇。感谢您的投入:)

最佳答案

您正在寻找的是一种将状态映射到操作的策略。

虽然您可以使用神经网络来存储您的策略,但您需要某种方式与环境交互以收集数据。

您所描述的是一个典型的强化学习问题。我建议你看看Q-learning。对于状态空间的大小,您可以轻松地将策略存储在表中,但如果您愿意,神经网络也很容易与 Q-learning 结合(尽管在使用非线性近似方案时不能确保收敛)。

关于machine-learning - 如何用神经网络实现寻路和拥塞检测?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35647440/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com