gpt4 book ai didi

machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性?

转载 作者:行者123 更新时间:2023-11-30 09:08:08 26 4
gpt4 key购买 nike

img

如图所示,AlphaGo Zero 神经网络使用损失函数,该函数使用 MCTS 概率和值作为真实标签。我试图了解神经网络的输出是否被视为逻辑(例如实值)或原始概率([0,1])。在损失函数中,看起来 MCTS 概率(我确信位于 [0,1] 中)是向量乘以 NN 概率的对数。这是损失中的负项,但是该项的大小表明两个向量的相似性是什么?为什么值越大表示相似度越高?

最佳答案

结果是交叉熵损失的蒙特卡罗估计,如所解释的 here .

关于machine-learning - AlphaGo 零损失函数如何衡量 MCTS 概率和 NN 概率之间的相似性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47138694/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com