gpt4 book ai didi

python - Scikit-learn Imputer 降维

转载 作者:太空宇宙 更新时间:2023-11-04 00:47:18 27 4
gpt4 key购买 nike

我有一个包含 332 列的数据框。我想估算值以便能够使用 scikit-learn 的决策树分类器。我的问题是 imputer 函数的结果数据列只有 330。

from sklearn.preprocessing import Imputer
imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
cols = data.columns
new = imp.fit_transform(data)

print(data.shape,new.shape)
(34132, 332) (34132, 330)

最佳答案

根据documentation of sklearn.preprocessing.Imputer :

When axis=0, columns which only contained missing values at fit are discarded upon transform.

因此,这是删除所有缺失值的列。

关于python - Scikit-learn Imputer 降维,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38900132/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com