gpt4 book ai didi

python - 是否可以忽略 NA 但不将其放入数据框中?

转载 作者:行者123 更新时间:2023-12-04 15:04:15 25 4
gpt4 key购买 nike

我的数据框有 80 列乘以 100 万行。

数据集中有很多 NaN,如果我要删除所有 NA 值,我将丢失太多数据以致于无法使用。

我想知道是否有一种方法可以遍历这些列,以及它什么时候会在以后进行任何计算,例如平均值、中值、模式或更高级的计算,它只是假装值不存在。

它并不总是只是 NaN,它有时包含应忽略的值,如“Infinity”。

是否有类似的东西:

Find NaN and Infinity in Dataframe, flag them and DO NOT CONSIDER them IN CALCULATIONS

我试着找到一个命令来执行此操作,但没有关于它的任何信息,也许我只是太傻了。

最佳答案

只需使用 numpy 中的 nanmean() 方法来查找具有 NaN 值的特定列的平均值

import pandas as pd
import numpy as np
series = pd.Series([np.nan, 1, np.nan, 3,np.nan,2])
mean=np.nanmean(series)

现在如果你打印这个:-

 print(mean)

它给出 2.0 作为输出,这意味着它不会影响平均计算,然后使用 df.fillna()

series.fillna(mean,inplace=True)

关于python - 是否可以忽略 NA 但不将其放入数据框中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66456241/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com