gpt4 book ai didi

pandas - 分类字段的可能性太多

转载 作者:行者123 更新时间:2023-11-30 09:20:24 26 4
gpt4 key购买 nike

我有 40 个输入分类字段,例如“CpuModel”(1523 种可能性)

它们中的每一个都可以有数千种可能性。

如果我使用 get_dummies,我的 panda 表将包含许多虚拟列。我计划将这个字段用作机器学习算法的输入特征。

我应该如何处理这个问题?

最佳答案

在这种情况下,您应该使用 labelencoder。
在分类列上使用它将返回一个列,其中的数值表示这些变量的频率计数。


引用:http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html


希望有帮助!

关于pandas - 分类字段的可能性太多,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41828990/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com