作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
这是一个传送系统。盒子从 A 处进入系统,然后移向 C 处,从 C 处退出系统。 B->D 也是如此。
路径 A->C 上的框比框 B->D 具有更高的优先级。箱子可以在每个方格停下来等待。如果A2上和B2上都有一个盒子,则A2上的盒子应该先经过X。
如果C2、C1、A2和B2上都有盒子,那么来自B2的盒子应该经过X,而A2上的盒子应该等待,直到C1为空。否则会阻塞 B->D 的路径。
如何使用神经网络解决这个问题?因此,对于每一回合,我都想输入每个 block 的当前状态,因此我想从哪里移动到下一个盒子应该移动的地方。
例如:系统状态:BOX 位于 A1结果:A1、A2
我不知道神经网络是否是解决这个问题的好工具,但我只是好奇。感谢您的投入:)
最佳答案
您正在寻找的是一种将状态映射到操作的策略。
虽然您可以使用神经网络来存储您的策略,但您需要某种方式与环境交互以收集数据。
您所描述的是一个典型的强化学习问题。我建议你看看Q-learning。对于状态空间的大小,您可以轻松地将策略存储在表中,但如果您愿意,神经网络也很容易与 Q-learning 结合(尽管在使用非线性近似方案时不能确保收敛)。
关于machine-learning - 如何用神经网络实现寻路和拥塞检测?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35647440/
ExecutorService 中的所有线程都忙于等待执行程序服务队列中卡住的任务。 示例代码: ExecutorService es=Executors.newFixedThreadPool(8);
我是一名优秀的程序员,十分优秀!