gpt4 book ai didi

machine-learning - CART算法使用的离散化方法是什么?

转载 作者:行者123 更新时间:2023-11-30 09:53:11 25 4
gpt4 key购买 nike

我目前正在开发一个 scikit-learn 项目,我想知道分类器使用的决策树算法是如何工作的。我尝试了解如何选择树节点上的测试,但我找不到有关该算法用于离散化连续变量的方法的任何解释。我在一篇论文中读到,一些决策树算法使用 Tschuprow 的 T 方法,但我不确定 CART 是否使用它。有人知道吗?

最佳答案

我不完全确定,但我想说 CART 根据数据评估某个连续变量的所有可能的分割。也就是说,如果我们有 X = {1, 3, 17, 24, 10005}分割点将是 X < 1 , X >= 1 , X >= 3 , X >= 17等等。

这是在每个节点选择最佳分割的唯一方法,尽管它的计算成本可能很高。如果我们只探索所有可能 split 的一个子集,我们最终可能会选择一个非最优(在贪婪意义上)的 split 。

关于machine-learning - CART算法使用的离散化方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40891906/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com