gpt4 book ai didi

python - Xgboost DMatrix 的初始化减少特征数量

转载 作者:太空宇宙 更新时间:2023-11-04 00:48:47 25 4
gpt4 key购买 nike

我试图理解以下情况:

  1. 当我创建新的 xgbost DMatrix 时

    xgX = xgb.DMatrix(X, label=Y, missing=np.nan)

  2. 基于具有 64 个特征的输入数据 X enter image description here

  3. 我得到了具有 55 个特征的新 DMatrix enter image description here

这里有什么魔力?任何建议都会很棒!

最佳答案

看看 xgboost issue #1223

在那里,khotilov 发表评论:

The problem with CSR is that when you have completely sparse columns at the end, you cannot figure out that they exist by just looking at CSR's indices and pointers.

这样做的结果是,从 X 创建 DMatrix 的函数 XGDMatrixCreateFromCSR 不考虑空列结束,在你的例子中是 9 列。您可能需要检查您的情况并确定您是否真的在 X 中拥有 64 个功能。

关于python - Xgboost DMatrix 的初始化减少特征数量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38101603/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com