作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 LSTM 解决一个简单的二元分类问题。我正在尝试找出网络的正确损失函数。问题是,当我使用二元交叉熵作为损失函数时,与使用均方误差(MSE)函数相比,训练和测试的损失值相对较高。
经过研究,我发现二元交叉熵应该用于分类问题,MSE 用于回归问题。然而,就我而言,通过 MSE 进行二元分类,我获得了更好的精度和更小的损失值。
我不确定如何证明这些结果的合理性。为什么不使用均方误差来解决分类问题?
最佳答案
我想用一个例子来展示它。假设有一个 6 类分类问题。
假设, 真实概率 = [1, 0, 0, 0, 0, 0]
情况1:预测概率 = [0.2, 0.16, 0.16, 0.16, 0.16, 0.16]
情况 2:预测概率 = [0.4, 0.5, 0.1, 0, 0, 0]
案例1和案例2的MSE分别为0.128和0.1033。
尽管情况 1 正确预测了实例的类别 1,但情况 1 中的损失高于情况 2 中的损失。
关于python - 为什么不使用均方误差来解决分类问题?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56013688/
我是一名优秀的程序员,十分优秀!