gpt4 book ai didi

python - Scikit Learn - 拟合和预测输入的顺序,重要吗?

转载 作者:太空宇宙 更新时间:2023-11-03 14:20:46 25 4
gpt4 key购买 nike

刚刚开始使用这个库...在使用 RandomForestClassifiers 时遇到一些问题(我已经阅读了文档但没有弄清楚)

我的问题很简单,假设我有一个像

这样的火车数据集

A B C

1 2 3

其中 A 是自变量 (y),B-C 是因变量 (x)。假设测试集看起来一样,但是顺序是

B A C

1 2 3

当我调用 forest.fit(train_data[0:,1:],train_data[0:,0])在运行之前我是否需要重新排序测试集以匹配此顺序? (忽略我需要删除已经预测的 y 值 (a) 的事实,所以我们只说 B 和 C 是乱序的...)

最佳答案

是的,您需要重新排序。想象一个更简单的情况,线性回归。该算法将计算每个特征的权重,例如,如果特征 1 不重要,它将被分配接近 0 的权重。

如果在预测时顺序不同,一个重要特征将乘以这个几乎为零的权重,预测将完全失败。

关于python - Scikit Learn - 拟合和预测输入的顺序,重要吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28270967/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com