- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
对于不熟悉的人来说,NetLogo 是一种基于代理的建模语言。在这种情况下,智能体在动态环境中模拟生物体,并在其中寻找能量。能量移动不可预测,但会随着时间的推移而扩散,以便觅食者可以通过“上坡”找到源头。 (我稍微简化了一点,智能体也进行社交和繁殖,但如果我们能找到一个好的进食和移动算法,那么它应该可以泛化)
目标是让智能体通过两个 Action 最大化他们的能量:移动 N/S/E/W 和进食。智能体可以访问一些信息:周围位置的能量水平和他们自己的能量,所有这些都是连续变量。代理无法完全明确地了解他们的过去或世界,这限制了大多数传统 RL 算法的使用。他们可以拥有隐性知识(例如,权重随时间调整的神经网络是可以的)。
我的直觉是神经网络可以解决这个问题,我成功地实现了一个……但我只是简单地运行了数千次模拟来优化权重。这 (1) 不能保证收敛,并且 (2) 可能远非最优/高效。
对于如何在这个世界上学习有什么想法吗?无论是更好的强化学习方法还是学习神经网络权重的算法都会很棒。我最近查阅了很多文献试图找到一个解决方案,但我发现的每个算法最终都会有一个或两个问题妨碍它们的使用。在此先感谢您的帮助!
最佳答案
由于您的环境是连续的,标准算法如 Q-learning或 SARSA不直接适用——他们期望一个离散的环境状态。但是,您的操作是离散的,这可能会有用。
一种可能性是使用一些贝叶斯方法来估计世界状态并将其应用于Reinforcement Learning with function approximation。 .事实上,这就是我在本科论文中所做的,其中状态是通过Bayesian Programming估计的。 .
关于algorithm - 具有离散 Action 的连续状态空间的强化学习(在 NetLogo 中),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23422679/
下面的脚本 test.php 旨在放置在我所有 wordpress 站点的特定目录中。它的作用是抓取下面$source地址的文件,解压到它所在的目录下。这就是它的全部意图。 例如,我将在我的中央服务器
我有以下代码,并且在 copyMessages() 处遇到资源注入(inject)问题。 我不知道如何解决这个问题? Abstract: Attackers are able to control t
上个学期我介绍了 Java 中的面向对象编程,下学期我将学习 Java 计算机科学 2,它基本上学习用 Java 实现的各种算法和数据结构,例如链表、二叉树等。 ..我可以通过哪些方法来巩固在面向对象
我很好奇 Fortify 规则集在 Android 应用程序中寻找哪些漏洞。不幸的是,我找不到任何相关文件。我知道他们四处寻找 Java 特定的漏洞以及组件的权限检查——还有其他吗? SQL注入(in
我在 fortify 报告中收到第 4 行的 XML 外部实体注入(inject)安全警告。不知道如何解决它。我对 SOAP、JAXB 和 Marshaller 还很陌生。 1 private
查找以“#PermitRootLogin yes”开头的行并替换为“PermitRootLogin no” 在底部添加一行“AllowUsers user1@test.com” 重新启动 sshd 守
我正在尝试强化我的 session 并找到了下面的代码。我的问题是这一行 isset($_SESSION['last_ip']) !== $_SERVER['REMOTE_ADDR']。 当我回显比较
当我在 Java 8 中包含以下代码时,我在 fortify 中遇到 Null Dereference 问题: String name = statusList.stream() .map(s
我有一个强化漏洞:跨站点脚本:DOM。 在我的应用程序(asp.net)中,我们动态构建 html 并将其分配给一个 div 标签,它在其中提示问题。 str += '
强化安全运行不合规代码 public static A read(String path) throws IOException, ClassNotFoundException { try (
出于安全考虑,我计划不允许 Azure 服务与 Azure 服务进行通信,而只允许与它正在使用的服务进行通信。 例如,我有一些使用 Azure SQL 数据库的 Web 应用程序。我应该只在 Azur
出于安全考虑,我计划不允许 Azure 服务与 Azure 服务进行通信,而只允许与它正在使用的服务进行通信。 例如,我有一些使用 Azure SQL 数据库的 Web 应用程序。我应该只在 Azur
早上好,我在 Android 项目上使用 native 库,它只是包签名的简单 md5hash,但是我在具有 JNI 功能的 64 位设备上遇到问题: char *getSignatureMd5(JN
我正在开发一个基于 struts 的 Web 应用程序。在该应用程序中,我们从 Jsp 生成并下载 xls 文件。在Jsp文件和web.xml中,我将内容类型设置为“application/vnd.m
我正在处理遗留系统,我们只是用 HP Fortify 扫描了它并得到了JavaScript Hijacking: Vulnerable Framework,代码如下。我能做些什么来确保这一点?我并不完
大家好,我有一个由 fopen 使用产生的强化问题“路径操作”。根据 fortify,我可以实现一个白名单来修复它,所以有我的白名单验证器: white_list.c #define BUFF_WHI
我们正在使用 Fortify 扫描我的 Android 源代码,但我无法解决这个问题: Category: Android Bad Practices: Missing Google Play Ser
我是一名优秀的程序员,十分优秀!