- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有兴趣编写某些使用机器学习并根据外部数据执行某些操作的软件。
但是我遇到了问题(这对我来说一直很有趣)-如何编写发布命令或命令序列的机器学习软件?
问题是,据我了解,神经网络会收集大量输入,并根据之前的训练结果“记忆”输出。立即(嗯,或多或少)。所以我不确定“发布命令”如何适合该系统,特别是当系统执行的操作以一定的延迟影响系统时。我也有点不确定如何训练这个东西。
此类系统的示例:
1.第一人称射击敌人 Controller 。据我了解,可以为机器人实现神经网络 Controller ,该 Controller 将根据某些输入(可能是健康状况、弹药等)切换机器人行为策略(好吧,为它们分配优先级)。但我没有找到一种方法来制作高阶 Controller ,它可以发出诸如“去那里,然后向左转”之类的命令序列。此外,机器人的行为将影响控制机器人行为的变量。 IE。射击会减少弹药,从高处坠落会减少生命值,等等
2.自动化市场交易者。当然有可能建立一个尝试预测某物的下一个市场价格的系统。然而,我不明白如何才能建立一个可以发出订单来购买某种东西,观察趋势,然后将其卖回以获得利润/弥补损失的系统。
3.汽车司机。同样,(据我所知)可以制作一个基于位置/速度/扭矩数据和先前训练结果维持所需运动矢量的系统。但是,我没有找到一种方法可以使此类系统(学习)执行一系列操作。
即据我了解,神经网络在技术上是一个矩阵——你给它输入,它产生输出。但是,生成可以改变程序运行环境的 Action 序列又如何呢?
如果此类任务不完全适合神经网络,还可以使用什么?
附注我知道这个问题不太清楚,我怀疑我遗漏了一些知识。所以我会很感激一些指示(即要阅读的书籍/资源等)。
最佳答案
您可以尝试将输出神经元直接连接到 Controller ,例如前进、转身、或在 self 射手中射击,或为交易者购买订单。然而,我认为现在当你让神经网络解决一个相当具体的子问题,然后让一个“正常”程序解释它的答案时,可以获得最好的结果。例如,您可以让神经网络构建“我想去哪里”的 map 叠加层,然后机器人将其转化为运动。交易者的神经网络可以生成“我想要哪张纸多少钱”,然后机器人将其转化为买入或卖出订单。
决定神经网络应该解决哪个子问题是其设计的一个非常核心的问题。重要的是可以将好的解决方案传授给神经网络。
编辑:在示例中扩展这一点:当 self 射击机器人被射击时,它不应该想在那里;当它要射击别人时,它应该更想在那里。当交易者因票据而亏损时,他之前就应该少花钱;如果它有所收获,它应该会更想要它。这些东西是可以教的。
关于language-agnostic - 发布订单的神经网络?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3489558/
在嵌入式系统编程的上下文中是否存在普遍差异? 最佳答案 这些不是正式的术语,所以这是相当主观的。 迁移意味着将您的代码库移动到另一个系统(无意返回)。这也可能意味着切换到另一个工具链或编程语言。 移植
听说任何递归算法都可以用栈来表示。最近,我一直在一个可用调用堆栈非常小的环境中编写程序。 我需要做一些深度递归,所以我想知道如何重新设计任何递归算法以使用显式堆栈。 例如,假设我有这样一个递归函数 f
这个问题与语言无关,但受到这些 c/c++ 问题的启发。 How to convert a single char into an int Char to int conversion in C 假设
我最接近汇编的是构建我自己的 Java 类库,它加载类文件并允许您创建、编译和反编译类。在努力完成这个项目时,我想知道 Java 虚拟机实际上是如何在 JIT 优化期间在运行时生成 native 机器
如标题所说的简单问题。我在 StackOverflow(和互联网)上看到了一些关于半字节用例的问题,但我不明白为什么我们需要使用半字节。我的意思是字节是计算中最小的内存单位,因此对它执行操作来操作它的
这真是一个详细的格式问题,但我每次都被它绊倒...... 对于多行条件表达式,逻辑运算符的首选位置是什么? 备选方案 1:每行末尾的逻辑运算符 if (value1 == comparision1 &
计算“2021-01-01 12:56:23.423 UTC”和“2001-01-01 00:00:00.000 UTC”之间的 SI 秒数” 为例。 最佳答案 C++20 可以用下面的语法来完成:
我正在读一本名为“干净的代码”的书,当作者试图讲述我们如何编写一个高效的函数时卡住了。他说,“为了确保我们的函数做”一件事, “我们需要确保我们函数中的语句都处于同一抽象级别”。那么作者究竟想通过抽象
我的网站上有一张相当大的图片(大约 200kb)。我没有计划在不久的将来改变它。我如何告诉浏览器缓存它? 最佳答案 设置正确的标题对您有很大帮助。 过期时间:2012 年 4 月 15 日星期四 20
一般来说,重构工具的优缺点是什么? 最佳答案 优势 如果工具对您有帮助,您更有可能进行重构。 一个工具更有可能在第一次正确地进行“重命名”类型重构。 一个工具可以让您在代码库上进行重构,而无需手动进行
当我第一次开始自学编程时,在完成教程后,我会觉得我仍然无法用语言做任何事情。所以,我环顾四周,想找点事情做。由于我刚刚学习了一些基础知识,因此查找、阅读和添加到一个开源项目中所涉及的工作量似乎是无法克
在我工作的公司,最近要求所有“高度可见”的 bool 逻辑必须以析取范式表示。 例如(尽管这个概念与语言无关), #if (defined(A) || defined( B )) || (define
我想知道我们如何在 mathematica 中设计一个魔方。这可能吗?我们如何使用它。我们如何决定立方体的 6 个面上的较小立方体的不同分隔。 最佳答案 您问的是如何定义数据结构。您的选择是任意的,只
对于具有系统托盘图标的应用程序的行为方式,是否有任何标准? 我最近编写了一个应用程序,它大部分时间都位于系统托盘中。我把它交给了一个 friend ,她的第一 react 是双击图标进入主窗口(工作正
一个商业可分发软件的文本长度和/或音频片段长度是多少才能通过合理使用的阈值并侵犯所包含作品的版权?归属是否可以免除开发者的侵权行为?一个例子是在启动屏幕上使用的小说中的引用。 最佳答案 不幸的是,没有
我是一名经验丰富的 C/C++/C#/Objective-C 桌面、Web 和移动程序员,我已经习惯于从头开始构建我的大部分软件。我已经使用 ASP.NET 从头开始构建了我的所有网站。对于我想测
我一直在阅读有关使用矩阵转换 Vector3 的内容,并且正在努力深入研究数学并自己编写代码而不是使用现有代码。无论出于何种原因,我的学校类(class)从未包括矩阵,所以我正在填补我的知识空白。谢天
所以我目前正在尝试掌握递归的概念,我理解我遇到的大部分问题,但我觉得它的使用似乎不适用于太多计算问题。不过,这只是一个新手的假设,所以我问,作为程序员,递归有很多实际用途吗?还有,用它可以解决哪些典型
我正在学习递归。我已经使用递归解决了一些其他问题,例如创建二叉树、汉诺塔等。所以,我明白什么是递归,但我发现自己很难规划和实现正确的递归解决方案。 是否有任何关于规划、思考或实现问题递归解决方案的一般
每次我需要移动到一台新机器,或者买一台笔记本电脑,或者通过不断的安装和卸载搞砸我的注册表时,我开始变得非常厌烦和厌倦设置我的所有开发工具。 这么新的计划。我听说有人虚拟化他们的开发环境,这听起来是个好
我是一名优秀的程序员,十分优秀!