gpt4 book ai didi

Python:查找 NA 值高于阈值的列的名称

转载 作者:太空宇宙 更新时间:2023-11-03 15:35:56 27 4
gpt4 key购买 nike

我知道如何从数据框中删除具有许多 NA 的列,

df = df.dropna(axis=1, thresh=100)

但是有办法知道他们的名字吗?

我想创建这样的东西:

na_values =  df.isnull().sum()/len(df)

这给了我一个列表,其中每列中都有 NA 的部分

x_9       0.011700
x_10 0.001307
x_11 0.025830
x_12 0.011691
x_13 0.002739
x_14 0.238406

但我只想提取阈值高于 0.2 的值,例如 x_14。

有什么想法吗?我尝试过:

print(i > 0.4 for i in na_values)

但是不起作用

最佳答案

您可以使用相同的Series和 bool 条件来屏蔽Series:

In [36]:
na_values[na_values>0.2]

Out[36]:
na
val
x_14 0.238406

你可以看到面具:

In [37]:
na_values > 0.2

Out[37]:
val
x_9 False
x_10 False
x_11 False
x_12 False
x_13 False
x_14 True
Name: na, dtype: bool

因此这将屏蔽所有False

关于Python:查找 NA 值高于阈值的列的名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42511630/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com