neural-network - 神经网络如何使用遗传算法和反向传播来玩游戏？-6ren

neural-network - 神经网络如何使用遗传算法和反向传播来玩游戏？

转载作者：行者123 更新时间：2023-12-04 04:29:50

48

4

我遇到了 this interesting video on YouTube on genetic algorithms .

正如您在视频中看到的，机器人学会了战斗。
现在，我研究神经网络已经有一段时间了，我想开始学习遗传算法。这以某种方式结合了两者。

你如何结合遗传算法和神经网络来做到这一点？
在这种情况下，人们又如何知道用于反向传播和更新权重并训练网络的错误？以及您认为视频中的程序如何计算其适应度函数？我猜视频中的程序肯定会发生突变，但是交叉呢？

谢谢!

最佳答案

这是一个强化学习问题，其中神经网络的输出是键盘上要按下的键，以便最大化适应度函数给出的分数。使用遗传算法 (GA) 并从初始神经网络架构开始，GA 倾向于找到更好的架构，以迭代方式最大化适应度函数。 GA 通过繁殖它们来生成不同的架构，然后将它们用于任务(玩游戏)，选择产生更高分数的架构(使用适应度函数)。下次 GA 使用最佳架构候选者(GA 术语中的父代)用于繁殖，并再次重复生成新种群(架构)的过程。当然，育种也包括突变。

这个过程一直持续到满足终止标准(适应度函数的特定值或生成多个种群)。您可能会注意到遗传算法的计算量非常大，因此在处理大规模问题时会被遗弃。自然地，在生成架构时，它会使用反向传播或任何其他适用的优化技术(包括 GA)进行训练。

例如，this video展示了遗传算法如何帮助选择“最佳”架构来玩马里奥，而且它做得非常好!但是，请注意，如果 GA 选择一种架构来在一个级别中很好地玩 Mario，那么该架构在下一级别中不一定表现良好，如 another video 所示。 .在我看来，这是因为遗传算法和反向传播都倾向于找到局部最小值。所以还有很长的路要走……

来源

Genetic Algorithms

Fitness function

The paper Evolving Neural Networks through Augmenting Topologies

关于neural-network - 神经网络如何使用遗传算法和反向传播来玩游戏？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34553205/

48

4

0

文章推荐： apache-zookeeper - Zookeeper 自动清除功能不起作用

文章推荐： user-interface - 在 Qt 中重新排序小部件

scala - 玩!框架数据库脚本应用程序错误
我正在尝试创建一个数据库来处理我在 Play 中的任务!框架。这是我所拥有的: 在build.sbt中: libraryDependencies ++= Seq( jdbc, cache,
scala - 玩!错误重载方法值映射与替代方案？
在我的游戏中定义一个表单!当编译器吐出这个奇怪的错误时 Controller :重载方法值映射与替代:...[一堆废话]...Error occurred in an application invo
constraints - 玩! - 最大约束不起作用
我的应用程序有问题，@Max约束注释。我的 Controller 方法定义如下: public static void save(@Required @Max(255) String content
playframework - 玩!如何在模板标签中检索具有实体和字段名称作为参数分别传递的字段值？
我想创建一个像这样的标签: #{some_tag entity:user, field:'name'} 并期望它通过使用如下表达式生成带有用户名的输出: ${_entity._field} 我知道这行
java - 玩!删除时的框架参照完整性约束
我创建了一些 Model 对象来代表一家拥有多个客户的公司，以及一个由公司和客户组合以及多个发票行组成的发票对象。我创建了以下模型对象: @Entity public class Company ex
scala - 玩!框架或类型安全堆栈
Playframework 现在是 typesafe-stack 的一部分。那么，如果我要使用像主要语言一样的 Scala ，我现在应该下载什么？ TypsafeStack 还是 PlayFrame
jpa - 玩!框架立即保存？
在玩!如果你这样称呼: void method() { User u = User(); u.name = "bob"; u.save(); while(true){/* endless loop *
jpa - 玩!框架历史数据变化
我正在 Play 中构建一个应用程序!包含大量我想跟踪更改的数据的框架。在企业解决方案中，我可能会使用数据库触发器将更改复制到历史表中以跟踪这些更改。我不熟悉 Play!/JPA 中的类似范例，但也许
javascript - 。玩();不适用于html5音频
我一直在学习JavaScript技能，但是遇到一个问题，当单击此处是我的代码时，音频没有被播放。 Your browser does no
java - 玩!保存模型操作后的行为
我想实现在某些模型保存后在表中插入一行的行为。我当前的解决方案简而言之是:(这只是我的代码示例，因此请不要评论数据库或描述符模型的正确性)。我有一个监听器，用于在更新/插入实体上插入行为行 Desc
java - 玩! - 独特的模型领域
如何使我的模型类字段独一无二？例如。如果已经登录，我想为用户显示正确的消息。我必须自己编写验证检查并使用它，或者可以使用 JPA @UniqueConstraint？最佳答案我是这样做的: @En
hash - 玩!哈希密码返回错误结果
我使用的是 Play 1.2.1。我想对我的用户密码进行哈希处理。我认为 Crypto.passwordHash 会很好，但事实并非如此。 passwordHash 文档说它返回 MD5 密码哈希值。
java - 玩!框架强化流程
我一直在研究戏剧!框架模块并希望扩展它，添加一些功能。我发现了一个从Enhancer(play.classloading.enhancers.Enhancer)扩展的类，但不明白为什么Play!采用了
java - 玩!验证不起作用
我使用的是 Play Framework 1.2.5。我有几个与 NAme 和 Age 字段相关的验证。年龄验证无法正常工作。即使年龄大于 18 岁，我也会收到错误消息。下面是action方法中的验
java - 玩!模板语法
我使用的是 Play Framework 1.2.5。两者有什么区别: @{Application.render()} 和 @Application.render() 第一个最好用在表单 Action
java - 玩!表格总是有错误
我是新来的!我被一些总是有错误的表格所困扰。即使所有字段都已填写，我也无法弄清楚问题是什么。路线 GET /products/ controllers.Pr
java - 玩!框架保存表单中的行列表
我显示可编辑的数据库表行的列表。我想允许用户编辑显示表中的数据并同时保存所有更新。我应该如何取回 Controller 的更新列表？最佳答案由于 Play 可以绑定(bind)到 POJO，也可以
java - 玩! - 动态结束作业
那么，假设我从 Controller 异步启动一个作业，然后渲染一些模板。 MyJob job = new MyJob(); job.doJob(); render(); 我的工作看起来像: 导入 p
java - 玩!框架升级复杂性
当前使用的 Play Framework 为 2.0.4。当我尝试使用此命令升级到 2.6.21 时: addSbtPlugin("com.typesafe.play"% "sbt-plugin"%
java - 玩!框架日志记录仅适用于系统级别
我目前正在与 Play 合作!框架和看来日志记录只适用于游戏!仅但对于具有 LOGGER 初始化的类不起作用。这是 logback.xml ${application.hom

首页

博学

6Ren·AI

商城

neural-network - 神经网络如何使用遗传算法和反向传播来玩游戏？