gpt4 book ai didi

python - 具有多个值的 Scikit-learn Imputer

转载 作者:行者123 更新时间:2023-12-01 09:20:46 26 4
gpt4 key购买 nike

有没有办法让 Scikit-learn Imputer 查找并替换多个被视为“缺失值”的值?

例如,我想做类似的事情

imp = Imputer(missing_values=(7,8,9))

但根据文档,missing_values参数仅接受单个整数:

missing_values : integer or “NaN”, optional (default=”NaN”)

The placeholder for the missing values. All occurrences of missing_values will be imputed. For missing values encoded as np.nan, use the string value “NaN”.

最佳答案

为什么不在原始数据集中手动执行此操作?假设您正在使用 pd.DataFrame 您可以执行以下操作:

import numpy as np
import pandas as pd
from sklearn.preprocessing import Imputer

df = pd.DataFrame({'A': [1, 2, 3, 8], 'B': [1, 2, 5, 3]})
df_new = df.replace([1, 2], np.nan)
df_imp = Imputer().fit_transform(df_new)

这会产生df_imp:

array([[ 5.5,  4. ],
[ 5.5, 4. ],
[ 3. , 5. ],
[ 8. , 3. ]])

如果您想使其成为管道的一部分,您只需要实现具有类似逻辑的自定义转换器。

关于python - 具有多个值的 Scikit-learn Imputer,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50806354/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com