gpt4 book ai didi

svm - 您如何处理 SVM 中的数据不平衡?

转载 作者:行者123 更新时间:2023-12-04 15:14:02 28 4
gpt4 key购买 nike

如果我在 lrge 训练集上训练 SVM,并且类变量是 True 或 False,那么与训练集中的 False 值数量相比,True 值很少会影响训练模型/结果吗?他们应该平等吗?如果我的训练集的 True 和 False 分布不均,我该如何处理以尽可能高效地完成训练?

最佳答案

有不平衡的数据很好,因为 SVM 应该能够对与不太可能的实例相关的错误分类错误分配更大的惩罚(例如在您的情况下为“True”),而不是分配相等的错误权重,这会导致不受欢迎的分类器把一切都分配给大多数。但是,使用平衡数据可能会获得更好的结果。这完全取决于您的数据,真的。

您可以人为地倾斜数据以获得更平衡的数据。为什么不看看这篇论文:http://pages.stern.nyu.edu/~fprovost/Papers/skew.PDF .

关于svm - 您如何处理 SVM 中的数据不平衡?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11736125/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com