gpt4 book ai didi

python - 使用 sklearn imputer 类时数组索引过多

转载 作者:行者123 更新时间:2023-11-30 09:15:03 25 4
gpt4 key购买 nike

我正在练习机器学习中的数据集,在获取缺失值时,我使用了 imputer 类,但它给了我一个错误:数组索引太多。对于这个错误,我只是查看了所有 numpy 模块,但我没有任何想法来解决它。

import numpy as np
import matplotlib.pyplot as mlp
import pandas as pd

#import datasets
i_export = pd.read_csv("2018-2010_export.csv")
x=i_export.iloc[:, [0,1,3,4]].values
y=i_export.iloc[:,2].values

#splitting training test set
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.2,random_state=0)

#calculating missing data
from sklearn.impute import SimpleImputer
impute=SimpleImputer(missing_values=np.nan,strategy='mean')
impute=SimpleImputer.fit(y_test[:,0])
y_test[:,0]=SimpleImputer.fit_transform(y_test[:,0])

最佳答案

我认为 y_test 是一个一维数组。当您尝试为 y_test[:,0] 建立索引时,您正在尝试为两个维度建立索引。

您可以使用此代码段将 y_test 数组转换为具有一列和“n”行的二维数组 y_test = y_test.reshape(-1,1)

这是我对您的代码的更改。我对您使用简单输入器的方式做了一些更改。

from sklearn.impute import SimpleImputer
imputer=SimpleImputer(missing_values=np.nan,strategy='mean')
y_test=imputer.fit_transform(y_test.reshape(-1, 1))

关于python - 使用 sklearn imputer 类时数组索引过多,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58068428/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com