gpt4 book ai didi

data-science - 分类变量的标准化或缩放

转载 作者:行者123 更新时间:2023-12-04 14:53:16 31 4
gpt4 key购买 nike

我对数据科学还很陌生。我正在研究使用基于产品编号和商店编号作为预测变量的线性回归来预测销售需求的用例。可以有许多具有数值的商店和产品。如果这些变量/预测变量的值是数字的、无界的并且在不同的尺度上,我是否需要标准化或缩放这些变量/预测变量?我相信如果我尝试使用交互术语,我会对其进行标准化吗?

最佳答案

由于这些是分类特征,在使用线性模型之前,您应该对其进行正确编码以创建合理的模型。如果您可以对这些分类特征进行编码以赋予它们线性相关性,那么您可以对其进行标准化,否则它就没有意义。如果您使用基于树的模型,则无需编码,因为它们能够发现非线性关系。

Edit-note:可以尝试使用mean-encodings的方法。 CV循环、扩展均值等方法

关于data-science - 分类变量的标准化或缩放,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/68660271/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com