gpt4 book ai didi

machine-learning - 机器学习预处理中大范围缩放数据

转载 作者:行者123 更新时间:2023-11-30 08:31:37 25 4
gpt4 key购买 nike

我对机器学习非常陌生。我正在尝试将机器学习应用于包含近 50 个特征的数据。有些特征的范围是0到1000000,有些特征的范围是0到100,甚至更小。现在,当我通过使用 MinMaxScaler 范围 (0,1) 来使用特征缩放时,我认为具有大范围的特征会缩小到非常小的值并且这可能会影响我做出好的预测。

我想知道是否有一些有效的方法来进行缩放,以便所有功能都得到适当的缩放。

我也尝试过标准缩放器,但准确性没有提高。另外,我可以对某些功能使用不同的缩放功能,而对其余功能使用另一个缩放功能吗?

提前致谢!

最佳答案

特征缩放或数据标准化是训练机器学习模型的重要组成部分。通常建议对所有特征使用相同的缩放方法。如果不同特征的尺度差异很大,这可能会对您的学习能力产生链式 react (取决于您使用的方法)。通过确保标准化特征值,所有特征在其表示中隐式加权相同。

两种常见的标准化方法是:

  • 重新缩放(也称为最小-最大标准化):

    enter image description here

    其中x是原始值,x'是标准化值。例如,假设我们有学生的体重数据,学生的体重跨度为[160磅,200磅]。为了重新调整此数据,我们首先从每个学生的体重中减去 160,然后将结果除以 40(最大体重和最小体重之间的差值)。

  • 均值归一化

    enter image description here

    其中 x 是原始值,x' 是标准化值。

关于machine-learning - 机器学习预处理中大范围缩放数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51366060/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com