gpt4 book ai didi

matlab - TreeBagger() (MATLAB) 以及训练集和测试集上不同数量的变量

转载 作者:行者123 更新时间:2023-11-30 09:11:46 25 4
gpt4 key购买 nike

我正在使用 MATLAB 函数 TreeBagger() 进行随机森林分类,以进行作业。当测试数据的变量数量与训练数据的变量数量不同时,会出现错误。

我被告知变量选择应该仅在训练数据上进行,而不是在测试数据上进行,这样测试数据就不会出现偏差。因此,在将初始数据集(50 个变量)拆分为训练集和测试集后,我对训练集执行变量选择(独立性卡方检验)。因此训练集由 37 个变量组成,而测试集仍由 50 个变量组成。

我用了TreeBagger()训练训练集,然后使用测试集进行预测(函数 predict() )。我收到错误,因为测试集的变量数量与模型训练的变量数量不同。

仅在训练集上进行变量选择是错误的吗?有没有办法使用这个函数进行预测?

最佳答案

所选变量是最终模型的一部分。这意味着无论何时您想要使用最终模型,它都必须仅使用在训练集上选择的变量。因此,在应用 TreeBagger 模型之前,您可以过滤掉未选择的变量,然后应用它来获得对测试集的预测。

关于matlab - TreeBagger() (MATLAB) 以及训练集和测试集上不同数量的变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34380626/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com