gpt4 book ai didi

machine-learning - 标准化测试集但范围更高

转载 作者:行者123 更新时间:2023-11-30 09:41:45 24 4
gpt4 key购买 nike

我正在规范化并重新调整我的训练集:

# zero mean
feat = (feat - feat.mean()) / feat.std()

# scale between -1, 1
feat = ((feat - feat.min()) / (feat.max() - feat.min())) * 2 - 1

这很好用。我以完全相同的方式转换测试集,使用训练集中的平均值、STD、最小值、最大值。如果测试集中的平均值和最大值与训练集相同,则效果很好。但是,如果测试集中未转换特征的范围不同,那么重新缩放后我的值将超出 -1、1。如何解决这个问题?

最佳答案

如果大部分测试输入的值高于或低于用于训练模型的极值,那么理想情况下您应该重新训练模型,因为您的训练分布和测试分布是不同的。

对于异常(异常值)之类的测试实例,您可以将值剪辑在训练最大/最小值之间,以实现最小最大缩放。

在标准化的情况下,您的测试可以是任何值,您只会获得极端情况下的大 z 分数。

关于machine-learning - 标准化测试集但范围更高,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57839639/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com