gpt4 book ai didi

machine-learning - SVM 的标准化特征值

转载 作者:行者123 更新时间:2023-11-30 08:25:17 27 4
gpt4 key购买 nike

我一直在尝试一些 SVM 实现,我想知道 - 标准化特征值以适应一个范围的最佳方法是什么? (从0到1)

假设我有 3 个特征,其值范围为:

  1. 3 - 5。

  2. 0.02 - 0.05

  3. 10-15。

如何将所有这些值转换为 [0,1] 范围?

如果在训练期间,我将遇到的特征号 1 的最高值为 5,并且在我开始在更大的数据集上使用我的模型后,我会偶然发现高达 7 的值,该怎么办?那么在转换后的范围内,就会超过1...

如何在训练期间对值进行标准化,以考虑“野外值”超过训练期间模型“看到”的最高(或最低)值的可能性?当这种情况发生时,模型将如何 react 以及如何使其正常工作?

最佳答案

除了 Tim 提供的缩放到单位长度方法之外,standardization最常用于机器学习领域。请注意,当您的测试数据到来时,使用训练样本的平均值和标准差来进行此缩放更有意义。如果您有大量的训练数据,可以安全地假设它们服从正态分布,因此新的测试数据超出范围的可能性不会那么高。引用这个post了解更多详情。

关于machine-learning - SVM 的标准化特征值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20506682/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com