gpt4 book ai didi

python - 当我缩放数据时,输入包含 NaN、无穷大或对于 dtype ('float64' 来说太大的值

转载 作者:行者123 更新时间:2023-12-01 09:04:45 25 4
gpt4 key购买 nike

我正在尝试像这样标准化我的数据:

scaler = MinMaxScaler()
trainX=scaler.fit_transform(X_data_train)

我收到此错误:

ValueError: Input contains NaN, infinity or a value too large for dtype('float64').

X_data_train 是大小为 (95538, 550) 的 pandas DataFrame。真正奇怪的是,当我写

print (X_data_train.min().min())

它给出-5482.4473,类似地,对于最大值,我得到28738212.0,这对我来说似乎不是超高值......

此外,基于 54+ 投票 answer 给出的命令,我确实检查过我确实没有 NaNInfinity 。此外,当我检查尺寸时,我的 csv 中没有空白或类似内容

那么,问题出在哪里??

最佳答案

您还可以检查 NaNinf:

df = pd.DataFrame({'B':[4,5,4,5,5,np.inf],
'C':[7,8,9,4,2,3],
'D':[np.nan,3,5,7,1,0],
'E':[5,3,6,9,2,4]})

print (df)
B C D E
0 4.000000 7 NaN 5
1 5.000000 8 3.0 3
2 4.000000 9 5.0 6
3 5.000000 4 7.0 9
4 5.000000 2 1.0 2
5 inf 3 0.0 4

nan = df[df.isnull().any(axis=1)]
print (nan)
B C D E
0 4.0 7 NaN 5

inf = df[df.eq(np.inf).any(axis=1)]
print (inf)
B C D E
5 inf 3 0.0 4

如果要查找行中至少包含一个 NaN 的所有索引:

print (df.index[np.isnan(df).any(axis=1)])
Int64Index([0], dtype='int64')

和列:

print (df.columns[np.isnan(df).any()])
Index(['D'], dtype='object')

关于python - 当我缩放数据时,输入包含 NaN、无穷大或对于 dtype ('float64' 来说太大的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52149300/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com