gpt4 book ai didi

python - 导出特征重要性时添加额外列

转载 作者:太空宇宙 更新时间:2023-11-03 19:43:16 24 4
gpt4 key购买 nike

我正在使用 .feature_importances_ 将重要性值从回归树模型导出到 CSV。该树使用不同数量的变量运行多次。我希望添加一个额外的列,列出计算重要性时使用的变量数量。

目前我可以使用下面的代码将重要性值和变量名称导出到 CSV

Importance = list(zip(model.feature_importances_,list(X)))
Importance = pd.DataFrame(Importance,columns=["Importance","Feature_Name"])
Importance.to_csv('File.csv', mode='a', header=False)

我得到了一个如下所示的 CSV

  Imp  VarName
0 1.00 0mm
0 0.58 0mm
1 0.42 0.63mm
0 0.54 0.63mm
1 0.36 0mm
2 0.10 0.125mm

我正在寻找的是添加第四列,其中包含该树中使用的变量数量,因此输出将如下所示

  Imp  VarName NumVar
0 1.00 0mm 1
0 0.58 0mm 2
1 0.42 0.63mm 2
0 0.54 0.63mm 3
1 0.36 0mm 3
2 0.10 0.125mm 3

最佳答案

这应该可行,我添加一个 len 大小的数组以及 X 的 len 数的值。

import numpy as np

Importance = list(zip(model.feature_importances_, list(X), len(X) * np.ones(len(X))))
Importance = pd.DataFrame(Importance,columns=["Importance","Feature_Name", "NumVar"])
Importance.to_csv('File.csv')

第一次运行时,我认为你可以删除附加模式和标题为False

关于python - 导出特征重要性时添加额外列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60308728/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com