作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个高度不平衡的数据集。多数类(class)与少数类(class)的比例为 99:1。我想建立一个模型来准确预测少数群体。简单来说,我想进行成本敏感的学习,其中假阴性的成本应该高于假阳性的成本。但我没有在 R 中找到任何用于逻辑回归的包,它可以做同样的事情。
任何人都可以推荐一些具有 R 代码示例的网站文档来执行相同的操作。提前致谢。
最佳答案
对于任何不提供成本选项的算法,您可以对少数类进行过采样。例如,如果您想将它们加权 5 倍,那么只需将它们过采样 5 倍即可。
有很多关于如何处理不平衡数据的文献。一般方法包括对少数类别进行过采样或对多数类别进行欠采样。此外,您还可以使用更先进的技术,例如 SMOTE,它将根据您的少数群体创建综合观察结果。
在像您这样的高度不平衡的情况下,我发现多次对大多数进行过采样和对少数进行欠采样相结合,这样您就可以获得可以一起平均的多个模型,从而产生良好的结果。 (基本上,这是修改后的装袋)
关于r - 如何在 R 中实现逻辑回归的成本敏感学习,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40277299/
我是一名优秀的程序员,十分优秀!