gpt4 book ai didi

python-3.x - 何时使用 min-max-scaler 和 standardscaler

转载 作者:行者123 更新时间:2023-12-03 17:04:52 24 4
gpt4 key购买 nike

引用时使用min-max-scalerStandard Scalar .
我认为这取决于数据。是否有任何数据特征可以决定采用哪种预处理方法。
我看了docs但有人可以让我更深入地了解它。

最佳答案

缩放确实取决于您将使用的数据类型。大多数情况下,StandardScaler是首选的定标器。如果您知道自己有一些异常值,请查找 RobustScaler .

然后,您处理一些具有奇怪分布的特征,例如数字,使用这些缩放器不是最好的。事实上,在这个数据集上,有很多像素为零,这意味着对于这个涉及除以 std 的分布,您可以选择零。开发不会有好处。所以基本上当一个特征的分布远非正常时,那么你需要采取另一种选择。

在数字的情况下,MinMaxScaler是一个更好的选择。但是,如果您想将零保持为零(因为您使用稀疏矩阵),您将选择 MaxAbsScaler .

NB:也看看QuantileTransformerPowerTransformer如果您希望特征遵循正态/均匀分布,无论原始分布是什么。

关于python-3.x - 何时使用 min-max-scaler 和 standardscaler,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49408371/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com