gpt4 book ai didi

machine-learning - 属性的特征缩放

转载 作者:行者123 更新时间:2023-11-30 09:02:56 25 4
gpt4 key购买 nike

我使用两个特征来训练分类模型,即特征 A 和 B。特征 A 比特征 B 更重要。特征 A 具有序数数据,因此我对其进行了标签编码,其值范围从 1 到 5。特征 B也是一种分类特征,并且在标签编码后对其进行热编码

由于上述编码,特征 A 的值范围为 1 到 5,而特征 B 具有多列,每列值为 0 或 1。

现在,在我的模型训练之后,我的模型过于偏向特征 A,因为它的值范围从 1 到 5,而对特征 B 的关注却很少。

现在,如果我使用标准标量进行特征缩放,特征 A 的值将在 -1 到 1 之间,因此在模型训练之后,特征 B 比特征 A 更能做出决定。

是否有更好的方法来对两个特征进行特征缩放,以便特征 A 具有更多边缘,但又不会导致特征 B 被完全忽略

最佳答案

一旦进行热编码,您将仅拥有一组功能。模型不知道这些特征属于 A 还是 B。然后您可以计算特征重要性或者运行 Feature Selection Algorithms以便提高效率。

但是,如果您认为功能 A 更重要,请尝试缩放到除 -1 到 1 之外的其他限制,以便为功能 A 保留比功能 B 更多的列。或者相应地缩放两者。但同样,模型仅将其视为一组特征,因此请尝试更改模型/参数,而不是专注于此以提高性能。

关于machine-learning - 属性的特征缩放,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59573060/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com