gpt4 book ai didi

python - Python/Scikitlearn 中的分类变量,无需 one-hot 编码

转载 作者:行者123 更新时间:2023-11-30 08:59:20 25 4
gpt4 key购买 nike

是否可以在 Python/Scikit-learn GLM 模型中按原样使用分类变量?我确实意识到了 one-hot 编码的替代方案。我对这种方法的问题是我将无法测试整个变量的重要性。我只能测试编码变量(这是部分的)。

为什么 SAS 可以处理这样的变量,而 Python 却不能?请指教。

最佳答案

这实际上取决于您拥有的数据。例如,如果您可以为分类变量(序数值)指定某种顺序,例如 lowmediumhigh,那么您可以指定它们是 1、2 和 3 等数字。但是,如果没有任何顺序,事情就会变得有点棘手。除了 One-hot Encoding 之外,您还可以尝试 Helmert Coding Scheme 。您还可以阅读this blog post以进行更多分析。 sklearn 中对于分类变量还有各种其他编码方案:

您可以阅读有关其他 Categorical Encoders in Sklearn here 的更多信息.

关于python - Python/Scikitlearn 中的分类变量,无需 one-hot 编码,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46205630/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com