- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我即将编写一个基于强化学习的国际象棋引擎。我想训练一个评估函数并找出董事会最重要特征的权重。
我不是机器学习专家,我正在尝试从书籍和教程中学习。在每个教程中,奖励都非常简单,通常是 1、0,也许是 -1,但国际象棋中没有如此明显的奖励(无论将死位置如何)。例如,假设我在董事会中有一个情况。我进行 10 次(随机)移动,此时我应该计算奖励,即起始位置与当前位置之间的差异(或误差)。当我唯一的评估函数正在训练时,如何做这样的事情?
我想避免使用其他引擎的评分系统,因为我觉得那宁愿是监督学习,这不是我的目标。
最佳答案
你确实不能直接这样做。
我可以建议的一些方法:
关于machine-learning - 国际象棋评价函数的训练,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40137240/
Confusion rose because of this post. The author updated his post, and the result became clear. Concl
假设我有以下语句: bool foo=true; if (foo){ foo=false; } else{ //do
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 9 年前。 Improve
我有一个表单,其中有很多设置页面。所有的页面都是一样的,所以我宁愿只制作一个表格,然后传入它应该编辑的设置的名称。我该怎么做?假设该表单称为“ConfigForm”,我希望能够用这样的方式调用它: n
简单问题: 我通过 javascript 使用 Youtube gdata 来:评论、回复和喜欢/不喜欢视频。到目前为止一切正常! 但是,我正在尝试允许用户特别喜欢和不喜欢评论(就像在本地 youtu
我在设置 TableView 中有一个单元格,我想将用户直接发送到 Appstore 并打开应用程序页面,以便他们可以发表评论。在 Stackoverflow 中有很多关于此的内容,但在 iOS8 和
快速提问 - 如标题所述。那可能吗?我认为以下端点是我最好的选择:https://developers.google.com/youtube/v3/docs/comments/update ,但找不到
我是一名优秀的程序员,十分优秀!