gpt4 book ai didi

language-agnostic - 发布订单的神经网络?

转载 作者:行者123 更新时间:2023-11-30 08:35:30 25 4
gpt4 key购买 nike

我有兴趣编写某些使用机器学习并根据外部数据执行某些操作的软件。

但是我遇到了问题(这对我来说一直很有趣)-如何编写发布命令命令序列的机器学习软件?

问题是,据我了解,神经网络会收集大量输入,并根据之前的训练结果“记忆”输出。立即(嗯,或多或少)。所以我不确定“发布命令”如何适合该系统,特别是当系统执行的操作以一定的延迟影响系统时。我也有点不确定如何训练这个东西。

此类系统的示例:
1.第一人称射击敌人 Controller 。据我了解,可以为机器人实现神经网络 Controller ,该 Controller 将根据某些输入(可能是健康状况、弹药等)切换机器人行为策略(好吧,为它们分配优先级)。但我没有找到一种方法来制作高阶 Controller ,它可以发出诸如“去那里,然后向左转”之类的命令序列。此外,机器人的行为将影响控制机器人行为的变量。 IE。射击会减少弹药,从高处坠落会减少生命值,等等
2.自动化市场交易者。当然有可能建立一个尝试预测某物的下一个市场价格的系统。然而,我不明白如何才能建立一个可以发出订单来购买某种东西,观察趋势,然后将其卖回以获得利润/弥补损失的系统。
3.汽车司机。同样,(据我所知)可以制作一个基于位置/速度/扭矩数据和先前训练结果维持所需运动矢量的系统。但是,我没有找到一种方法可以使此类系统(学习)执行一系列操作。

即据我了解,神经网络在技术上是一个矩阵——你给它输入,它产生输出。但是,生成可以改变程序运行环境的 Action 序列又如何呢?

如果此类任务不完全适合神经网络,还可以使用什么?

附注我知道这个问题不太清楚,我怀疑我遗漏了一些知识。所以我会很感激一些指示(即要阅读的书籍/资源等)。

最佳答案

可以尝试将输出神经元直接连接到 Controller ,例如前进、转身、或在 self 射手中射击,或为交易者购买订单。然而,我认为现在当你让神经网络解决一个相当具体的子问题,然后让一个“正常”程序解释它的答案时,可以获得最好的结果。例如,您可以让神经网络构建“我想去哪里”的 map 叠加层,然后机器人将其转化为运动。交易者的神经网络可以生成“我想要哪张纸多少钱”,然后机器人将其转化为买入或卖出订单。

决定神经网络应该解决哪个子问题是其设计的一个非常核心的问题。重要的是可以将好的解决方案传授给神经网络。

编辑:在示例中扩展这一点:当 self 射击机器人被射击时,它不应该想在那里;当它要射击别人时,它应该更想在那里。当交易者因票据而亏损时,他之前就应该少花钱;如果它有所收获,它应该会更想要它。这些东西是可以教的。

关于language-agnostic - 发布订单的神经网络?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3489558/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com