gpt4 book ai didi

python - 使用 scikit-learn 的 Imputer 模块预测缺失值

转载 作者:太空狗 更新时间:2023-10-29 16:53:06 25 4
gpt4 key购买 nike

我正在编写一个非常基本的程序,使用 scikit-learn 的 Imputer 类来预测数据集中的缺失值。

我制作了一个 NumPy 数组,创建了一个带有 strategy='mean' 的 Imputer 对象,并对 NumPy 数组执行了 fit_transform()。

当我在执行 fit_transform() 后打印数组时,'Nan's 仍然存在,我没有得到任何预测。

我在这里做错了什么?我该如何预测缺失值?

import numpy as np
from sklearn.preprocessing import Imputer

X = np.array([[23.56],[53.45],['NaN'],[44.44],[77.78],['NaN'],[234.44],[11.33],[79.87]])

print X

imp = Imputer(missing_values='NaN', strategy='mean', axis=0)
imp.fit_transform(X)

print X

最佳答案

根据 the documentationsklearn.preprocessing.Imputer.fit_transform 返回一个新数组,它不会改变参数数组。因此,最小的修复是:

X = imp.fit_transform(X)

关于python - 使用 scikit-learn 的 Imputer 模块预测缺失值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25017626/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com