machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性？-6ren

machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性？

转载作者：行者123 更新时间：2023-11-30 09:08:08

如图所示，AlphaGo Zero 神经网络使用损失函数，该函数使用 MCTS 概率和值作为真实标签。我试图了解神经网络的输出是否被视为逻辑(例如实值)或原始概率([0,1])。在损失函数中，看起来 MCTS 概率(我确信位于 [0,1] 中)是向量乘以 NN 概率的对数。这是损失中的负项，但是该项的大小表明两个向量的相似性是什么？为什么值越大表示相似度越高？

最佳答案

结果是交叉熵损失的蒙特卡罗估计，如所解释的 here .

关于machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47138694/

文章推荐： javascript - 使用 JavaScript 允许数字字段中的小数

文章推荐： javascript - 剥离变量 : javascript 中的文本

algorithm - AlphaGo self 提升
我读过几篇关于 AlphaGo 的新闻文章，它们都提到 AlphaGo 从先与人类对弈，然后与自己对弈，变得更好。我很好奇的一件事是，AlphaGo 是如何改进自己的？它会修改代码中的变量吗？或者它会
java - 使用 DL4J 评估图像，类似于 AlphaGo
我最近下载了 Deeplearning for Java (DL4J)，现在正在尝试使用卷积网络。我在主页和互联网上找到了一些工作示例，例如如何对图像进行分类，即识别人脸。我大致了解如何读取训练数据以
machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性？
如图所示，AlphaGo Zero 神经网络使用损失函数，该函数使用 MCTS 概率和值作为真实标签。我试图了解神经网络的输出是否被视为逻辑(例如实值)或原始概率([0,1])。在损失函数中，看起来

行者123

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性？