- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我打算使用 神经网络用于逼近 中的值函数强化学习算法。我想这样做是为了在我如何表示状态和 Action 方面引入一些概括性和灵活性。
现在,在我看来,神经网络是实现这一目标的正确工具,但由于我不是 AI 专家,因此我在这里的知名度有限。特别是,如今神经网络似乎正在被其他技术所取代,例如支持向量机,但我不确定这是否是一个时尚问题,或者神经网络中是否存在一些真正的限制可能会破坏我的方法。你有什么建议吗?
谢谢,
通努兹
最佳答案
的确,神经网络不再像以前那样流行,但它们几乎没有消亡。他们失宠的一般原因是Support Vector Machine的兴起。 ,因为它们全局收敛并且需要更少的参数规范。
然而,SVM 实现起来非常繁重,并且不像 ANN 那样自然地推广到强化学习(SVM 主要用于离线决策问题)。
如果您的任务似乎适合某个人,我建议您坚持使用 ANN,因为在强化学习领域,ANN 在性能方面仍处于领先地位。
Here's a great place to start ;只需查看标题为“时间差异学习”的部分,因为这是 ANN 解决强化学习问题的标准方式。
一个警告:机器学习的最新趋势是通过 bagging or boosting 一起使用许多不同的学习代理。 .虽然我在强化学习中没有看到这么多,但我确信采用这种策略仍然比单独使用 ANN 强大得多。但除非你真的需要世界一流的性能(这就是赢得 Netflix 比赛的原因),否则我会避开这种极其复杂的技术。
关于neural-network - 神经网络真的是废弃软件吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6910859/
我使用cocos2d-x和Lua进行开发。最近我使用 Instruments 并发现了一些被废弃的内存:cocos2d-x 在自己的自动释放池中对对象执行释放,但我仍然有来自 Lua 的引用。如何确定
我是一名优秀的程序员,十分优秀!