gpt4 book ai didi

python - 如何在Python随机森林模型中删除可预测值(y)

转载 作者:行者123 更新时间:2023-11-30 09:17:32 25 4
gpt4 key购买 nike

我在 python 中运行随机森林模型来查看特征的重要性。然而,可预测值 (y) 不能被删除,看起来它是占据超过 98% 重要性的参数之一。

代码如下:

temp=pd.read_csv('temp_data.csv',sep=',',engine='python')
temp['y'] = temp['temp_actual']
y = temp['y'].values
temp = temp.drop(['y'],axis=1)

#X = temp.loc[:,:]
x= temp.values

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.3, random_state=42)

请帮助纠正编码。谢谢!

最佳答案

在您的代码中,您使用代码将目标功能复制到 y

temp['y'] = temp['temp_actual']

然后将 y 设置为该列中的值

y = temp['y'].values

然后,您使用以下代码从数据框中删除列 y

temp = temp.drop(['y'],axis=1)

现在,如果您查看数据帧 temp 的列,您可以看到 y 不存在,但 temp_actual 存在。

您必须从数据框中删除该列,为此,您可以执行以下任何方法。

del temp['temp_actual']

或者

temp = temp.drop(['temp_actual'], axis=1)

关于python - 如何在Python随机森林模型中删除可预测值(y),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51256753/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com