作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
假设我对一些倾斜的数据分布执行 DNN 回归任务。现在我使用平均绝对误差作为损失函数。
机器学习中的所有典型方法都是最小化平均损失,但对于倾斜来说这是不恰当的。从实际角度来看,最好尽量减少中值损失。我认为一种方法是用一些系数来惩罚巨大的损失。然后平均值将接近中位数。但是如何计算未知分布类型的系数呢?还有其他方法吗?你有什么可以建议的?(我使用的是tensorflow/keras)
最佳答案
只需使用keras中的平均绝对误差损失函数,而不是均方。平均绝对值几乎等于中位数,并且无论如何对于异常值或倾斜数据都更加稳健。您应该查看所有可能的 keras 损失:
显然,您也可以创建自己的。但对于大多数数据集,仅根据经验证明均方可以提高准确性。所以我建议在选择平均绝对方法之前至少尝试这两种方法。
关于machine-learning - 回归。优化偏态分布的中位数而不是均值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44561673/
我是一名优秀的程序员,十分优秀!