- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
基于我的上一个question我构建了一个 3D 游戏,其中两个机械臂正在互相打乒乓球。机器人有六个自由度。
状态由以下部分组成:
所有值均已标准化,因此它们的值介于 [-1,1] 之间。通过 4 个连续帧,我总共获得了 37 个参数的输入。
奖励
输出
机器人的六个关节中的每一个都可以以一定的速度移动,因此每个关节都有可能朝正方向移动、停留或朝负方向移动。这会产生 3^6=729 个输出。
通过这些设置,神经网络应该学习机器人的逆运动学并打乒乓球。我的问题是,我的网络收敛了,但似乎陷入了局部最小值,并且根据配置,随后开始收敛。我首先尝试了具有 1000 个节点的两个和三个隐藏层的网络,经过几个时期后,网络开始收敛。我意识到 1000 个节点太多了,并将其降低到 100 个,结果,网络的行为如所描述的,它首先收敛,然后稍微发散。所以我决定添加隐藏层。目前,我正在尝试一个具有 6 个隐藏层、每个隐藏层 80 个节点的网络。当前损失如下所示:
经验丰富的机器学习专家,您怎么看?您发现我的配置有什么问题吗?您会选择哪种类型的网络?
我很高兴收到每一个建议。
最佳答案
我过去也遇到过类似的问题。目标是使用神经进化框架 NEAT 学习机械臂的逆运动学。左图中是误差图。一开始一切正常,网络有所改善,但在某个点上,误差值保持在相同值,甚至在计算 30 分钟后也没有变化。我不认为你的神经网络是错误的,或者神经元的数量是错误的。我认为,神经网络通常无法学习逆运动学问题。我还认为deepmind的著名论文(用神经网络玩Atari游戏)是假的。
但回到事实。 OP 中的图(平均损失)和我的图(人口适应度)都显示出在开始时的改善和一段时间后的停滞曲线,尽管事实上 cpu 100% 运行,但无法改善。寻找更好的解决方案。目前还不清楚神经网络需要优化多长时间才能出现明显的改进,甚至可能经过数天或数年的不断计算也找不到更好的解决方案。对文献的研究表明,对于每个中等或困难的问题,结果都是正常的,到目前为止还没有发明更好的神经网络或更好的学习算法。根本问题被称为组合爆炸,这意味着网络权重有数百万种可能的解决方案,而计算机只能扫描其中的一小部分。如果问题真的像“异或问题”一样简单,那么像反向传播或 RPropMinus 这样的学习算法就会找到解决方案。对于稍微困难的问题,例如在迷宫中导航、寻找逆运动学或钉孔任务,当前的神经网络都无法找到解决方案。
关于machine-learning - 乒乓球机器人神经网络的建议,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40159695/
我的对话 fragment 有问题。我想使用 android:onClick 属性,因为在我看来代码更清晰。 在我的布局中,我有以下声明: 现在我的 DialogFragment import an
我正在制作一个使用谷歌地图的应用程序,我的主要 xml 代码 fragment 如下: 我的java代码是: import android.os.Bundle; import com.googl
是否可以在一个应用程序中有两个单独的首选项?我有一个在运行时连接到外部可执行文件(引擎)的应用程序。应用程序有自己的偏好,引擎也有。这两者不能混用,因为下次用户可能会决定加载具有不同偏好的完全不同的引
这是“Google Catalogs”应用程序的快照。我只是想知道我们如何进行这种图像重叠。![enter image description here][1] 最佳答案 您可以使用 FrameLay
我制作了一个 GridView ,其中添加了图像。但我的问题是它显示的 gridview 尺寸非常小,其中只有 3 张图像,就像图片中那样,我想在其中显示 9 张图像。 小号 但我希望 gridvie
我目前正在学习如何在 Android 上创建和使用服务。我查看了 android SDK 以获得进一步的帮助,我发现了 android:enable=[true |假]。 在SDK中是这样说的: Th
在完成我的 Android 游戏时,我希望用户将他/她的分数与高分进行比较。为此,我将当前的最高分存储在 SQLite 数据库中。但我认为我的方法(似乎可行)笨拙且丑陋: //in the final
出于某种原因,谷歌没有为模拟器提供任何通知声音,我找不到任何关于如何加载通知声音的引用。 我遇到过这个线程:How to play ringtone/alarm sound in Android但是除
我的应用有以下样式: true #ffffff true 它在我使用的大多数手机上运行良好。 (LG G5、Nexus 5、Moto G)但是当我在 LeEco Pro
我想确保我的网站阻止 Selenium 和 QTP 等自动化工具。有没有办法做到这一点 ?网站上的哪些设置会导致 Selenium 失败? 最佳答案 适当考虑对原始问题“你到底为什么要这样做?”的评论
我正在处理我的联系表,我希望它尽可能地防止垃圾邮件。我正在使用一些方法作为反击: 使用 JavaScript 正则表达式验证电子邮件的合法性 验证所有字段是否具有足够的值 制作一个不可见的字段来吸引机
It's difficult to tell what is being asked here. This question is ambiguous, vague, incomplete, over
我正在制作一个 android 应用程序,我需要在我的应用程序中显示远程图像我使用以下代码。但图像未显示: for(int i=0;i
我有几个与 Android 操作系统中的 AIML 集成相关的问题。我对 Java 了解不多,但我对 AIML 了解很多。我制作了 AIML 文件,现在我想做的是制作一个可以加载文件并在 GUI 中运
我有一个具有“登录”和“注销”操作的应用程序。用户登录后,在他们注销时堆栈中可能还剩下任意数量的 Activity 。 当用户注销时,我希望重置所有应用程序状态。我清除了我的磁盘缓存和首选项,但在运行
我是 Android 应用程序开发的新手,我正在尝试开发一个可用的应用程序。但是我创建的这个页面自创建以来就出现了问题,我真的希望有人能帮助我解决这个问题。每次我运行这个程序时,应用程序都会关闭。 这
我尝试将 android:imeOptions 设置为 actionSend、actionSearch。但是键盘上没有“发送”或“搜索”按钮,只有普通的“Enter”键。我还尝试设置不同的输入类型。
我想创建一种方法来查看相机坐标的中心是否在某个区域的边界内,如果是,则执行一些操作。 当我尝试这样做时,出现错误:Operator !不能应用于 LatLngBounds。 我也试过 if(temp
我正在尝试将视频录制时长限制为 5 秒。我正在使用默认相机和此代码: intent.putExtra(MediaStore.EXTRA_DURATION_LIMIT, 5); 现在它在三星 S6 上工
我正在开发一款安卓游戏 https://code.google.com/p/something-soft/我的日志猫说它正试图激发游戏的 Intent ,但随后主线程似乎死了(出现 ActivityN
我是一名优秀的程序员,十分优秀!