gpt4 book ai didi

python - feature_names 必须是唯一的 - Xgboost

转载 作者:太空狗 更新时间:2023-10-30 02:26:49 24 4
gpt4 key购买 nike

我正在为一个非常稀疏的矩阵运行 xgboost 模型。

我遇到了这个错误。 ValueError:feature_names 必须是唯一的

我该如何处理?

这是我的代码。

  yprob = bst.predict(xgb.DMatrix(test_df))[:,1]

最佳答案

根据xgboost source code documentation , 此错误仅发生在 one place 中- 在 DMatrix 内部函数中。这是源代码摘录:

if len(feature_names) != len(set(feature_names)):
raise ValueError('feature_names must be unique')

所以,这里的错误文本非常直白;您的 test_df 至少有一个重复的特征/列名称。

您已在这篇文章中标记了 pandas;这表明 test_df 是 Pandas DataFrame。在这种情况下,DMatrix literally runs df.columns提取 feature_names。检查您的 test_df 是否有重复的列名,删除或重命名它们,然后再次尝试 DMatrix()

关于python - feature_names 必须是唯一的 - Xgboost,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43579180/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com