gpt4 book ai didi

machine-learning - 对不同的特征使用不同的特征缩放技术是否正确?

转载 作者:行者123 更新时间:2023-12-04 10:07:06 25 4
gpt4 key购买 nike

我读了这篇关于特征缩放的文章:
all-about-feature-scaling

两种主要的特征缩放技术是:

  • min-max scaler - 对于分布为 的特征 react 良好不是高斯 .
  • Standard scaler - 对 的功能响应良好高斯分布。

  • 看了其他的帖子和例子,好像我们总是用 缩放方法( min-maxstandard ) 所有功能 .

    我还没有看到示例或论文表明:
    1. go over all the features, and for each feature:
    1.1 check feature distribution
    1.2 if the feature distribution is Gaussian:
    1.2.1 use Standard scaler for this feature
    1.3 otherwise:
    1.3.1 use min-max scaler for this feature
  • 为什么我们不混合缩放方法?
  • 我的建议有什么问题或缺点?
  • 最佳答案

    然后,您的特征将具有不同的比例,这是一个问题,因为具有较大比例的特征将主导其余特征(例如,在 KNN 中)。使用 min-max 归一化的特征将被重新缩放到 [0,1] 范围内,而标准化的特征将被转换为负到正的范围(例如,[-2,+2] 甚至更宽的范围)小标准偏差)。

    import pandas as pd
    from sklearn.preprocessing import MinMaxScaler, StandardScaler

    dfTest = pd.DataFrame({'A':[14,90,80,90,70],
    'B':[10,107,110,114,113]})

    scaler = MinMaxScaler()
    dfTest['A'] = scaler.fit_transform(dfTest[['A']])

    scaler = StandardScaler()
    dfTest['B'] = scaler.fit_transform(dfTest[['B']])

    ax = dfTest.plot.scatter('A', 'B')
    ax.set_aspect('equal')

    enter image description here

    关于machine-learning - 对不同的特征使用不同的特征缩放技术是否正确?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61530077/

    25 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com