gpt4 book ai didi

python - 二元交叉熵与 2 个类别的分类交叉熵

转载 作者:行者123 更新时间:2023-12-01 00:36:22 24 4
gpt4 key购买 nike

当考虑将输入分类为 2 个类别之一的问题时,我看到的 99% 的示例都使用具有单个输出和 sigmoid 的神经网络作为其激活,然后是二元交叉熵损失。我想到的另一个选择是让最后一层产生 2 个输出,并使用 C=2 类的分类交叉熵,但我从未在任何示例中看到它。有什么理由吗?

谢谢

最佳答案

如果您在两个输出网络之上使用 softmax,您将得到的输出在数学上相当于使用 sigmoid 的单个输出> 在顶部。
算一下,你就会明白。

在实践中,根据我的经验,如果您查看两个输出网络的原始“logits”(在 softmax 之前),您会发现其中一个正好是另一个的负数。这是梯度将每个神经元完全拉向相反方向的结果。

因此,由于两种方法是等效的,单输出配置的参数较少,需要的计算量也较少,因此使用带有 sigmoid ob top 的单输出更有利。

关于python - 二元交叉熵与 2 个类别的分类交叉熵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57726064/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com