gpt4 book ai didi

python - 如何计算python中每列中丢失的数据?

转载 作者:行者123 更新时间:2023-11-28 22:15:28 24 4
gpt4 key购买 nike

我有一个包含 85 列的大型数据框。缺失数据已编码为 NaN。我的目标是获取每一列中缺失的数据量。所以我写了一个 for 循环来创建一个列表来获取金额。但它不起作用。

以下是我的代码:

headers = x.columns.values.tolist() 
nans=[]
for head in headers:
nans_col = x[x.head == 'NaN'].shape[0]
nan.append(nans_col)

我尝试使用循环中的代码通过将 head 更改为该列的名称来为特定列生成缺失值的数量,然后代码起作用并为我提供了缺失数据的数量在该专栏中。

所以我不知道如何更正 for 循环代码。有人好心帮我解决这个问题吗?我非常感谢你的帮助。

最佳答案

对于 pandas(python 数据分析库)中的列,您可以使用:

In [3]: import numpy as np
In [4]: import pandas as pd
In [5]: df = pd.DataFrame({'a':[1,2,np.nan], 'b':[np.nan,1,np.nan]})
In [6]: df.isnull().sum()
Out[6]:
a 1
b 2
dtype: int64

对于单个列或序列,您可以计算缺失值,如下所示:

In [1]: import numpy as np
In [2]: import pandas as pd
In [3]: s = pd.Series([1,2,3, np.nan, np.nan])

In [4]: s.isnull().sum()
Out[4]: 2

Reference

关于python - 如何计算python中每列中丢失的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52865323/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com