gpt4 book ai didi

machine-learning - 随机森林的混合预测器类型

转载 作者:行者123 更新时间:2023-11-30 09:23:18 25 4
gpt4 key购买 nike

我正在尝试使用随机森林为具有 5 个预测变量的数据集构建分类模型。预测变量有两个连续类型,一个可以是[0, 1000]区间内的实数值,另一个可以是[-10, 10]<区间内的实数值;一个预测变量的整数值为 [10000, 15000]。此外,剩下的两个预测变量是分类值,即 { A, B, C, D, E F}{NY, LA, Chicago}。是否需要任何程序来预处理这些不同的预测器类型?

最佳答案

许多穷举搜索算法都会偏向于具有多个值的变量。将变量选择和拆分选择过程分开似乎对此有所帮助,如 this 中所述。纸。他们有一个package也在 R 中实现。我不知道如何使用更常见的方法来避免混合类型数据的这种情况。然而,尽管这个问题会导致偏差,但根据我的经验,预测性能并没有太大不同,因此您的里程可能会有所不同。这取决于你在做什么。不管怎样我都会做一些模拟。同一个小组有两篇关于条件排列重要性的 BMC 生物信息学论文讨论了这些问题。

关于machine-learning - 随机森林的混合预测器类型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25370942/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com