gpt4 book ai didi

machine-learning - 有没有一种方法可以使用带有分类变量的决策树而无需进行单热编码?

转载 作者:行者123 更新时间:2023-11-30 08:52:57 29 4
gpt4 key购买 nike

我有一个包含 200 多个分类变量(非序数)和一些连续变量的数据集。我尝试过使用 one-hot 编码,但这会大大增加维度并导致得分很低。
似乎常规的 scikit-learn 树只能与已转换为 one-hot 编码(对于非序数变量)的 calcategori 变量一起使用,我想是否有一种方法可以创建一棵没有 one-hot 的树。我做了一些研究,发现有一个名为 h2o 的 API 可能有用,但我正在尝试找到一种在本地计算机上运行它的方法。

最佳答案

例如,您可以从 h2o.ai/downloads 或 pypi 安装适用于 Python 的 h2o-3 软件包。

h2o 包可以自动有效地处理分类值。建议先不要对它们进行 one-hot 编码。

您可以在 docs.h2o.ai 找到大量文档。

关于machine-learning - 有没有一种方法可以使用带有分类变量的决策树而无需进行单热编码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56907349/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com