gpt4 book ai didi

machine-learning - 分类器预测结果有偏差

转载 作者:行者123 更新时间:2023-11-30 09:13:17 24 4
gpt4 key购买 nike

我构建了一个具有 13 个特征(无二进制特征)的分类器,并使用 scikit 工具 (Normalizer().transform) 对每个样本进行单独标准化。

当我进行预测时,它会将所有训练集预测为正数,将所有测试集预测为负数(无论事实是正数还是负数)

我应该关注分类器、特征或数据中的哪些异常???

注释:1)我分别对测试集和训练集(针对每个样本)进行标准化。

2)我尝试了交叉验证,但性能是相同的

3) 我同时使用了 SVM 线性核和 RBF 核

4)我也尝试过没有标准化。但结果同样不佳

5) 我有相同数量的正向和负向数据集(各 400 个)以及 34 个正向测试集样本和 1000 多个负向测试集样本。

最佳答案

如果您正在使用平衡数据进行训练,“它预测所有训练集都是积极的”这一事实可能足以得出出现问题的结论。

尝试构建一些非常简单的东西(例如具有一两个特征的线性 SVM)并查看模型以及训练数据的可视化;按照 scikit-learn 示例:http://scikit-learn.org/stable/auto_examples/svm/plot_iris.html

您的输入数据也有可能有许多影响转换过程的大异常值...

关于machine-learning - 分类器预测结果有偏差,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21676849/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com