gpt4 book ai didi

machine-learning - 不平衡数据集的 KNN 分类器

转载 作者:行者123 更新时间:2023-11-30 08:48:11 26 4
gpt4 key购买 nike

我想估计分类器在我的不平衡数据集上的工作效果。当我尝试使用 sklearn 中的 KNN 分类器时,它对少数群体没有学到任何东西。所以我所做的就是用 k = R 拟合分类器(其中 r 是不平衡比 1: R),然后预测每个测试点的概率,如果少数类的分类器的概率输出将一个点分配给少数类大于R(其中r是不平衡比1:R)。我这样做是为了估计分类器的性能(F1-score)。我在生产中不需要分类器。我这样做对吗?

最佳答案

既然您在评论中提到您不想使用重采样,那么唯一的出路就是批处理。从您的多数类创建多个数据集,以便它们与少数类的比例为 1:1。训练多个模型,每个模型获得多数集的一部分和所有少数集。对所有模型进行预测并进行投票并决定最终结果。

但我建议使用 SMOTE 而不是这种方法。

关于machine-learning - 不平衡数据集的 KNN 分类器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56731324/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com