gpt4 book ai didi

python - 如何从 pandas 数据框中选择相同的行以及 null

转载 作者:行者123 更新时间:2023-11-30 22:26:16 25 4
gpt4 key购买 nike

我是 pandas 新手,在从数据帧中选择行时遇到问题。

以下是我的数据框:

 Index Column1 Column2 Column3       Column4  Column5
0 1234 500 NEWYORK NY NaN
1 5678 700 AUSTIN TX 5678956010
2 1234 300 NEWYORKCITY NY NaN
3 8910 235 RICHMOND FL 8484883666
4 8910 250 AUSTIN TX 8484883666
5 5324 150 AUSTIN TX NaN

1.) 我想选择在 Column5 中具有相同值的行。因此,输出数据帧应包含索引为 0、2、3 和 4 的行。请注意,只有当 Column1 值相同时,才应选择第 5 列中为 NaN 的两行(例如,索引为 0 和 2 的行)。

任何人都可以帮助我完成此自定义选择的分步过程吗?提前致谢...

最佳答案

我认为你需要 2 组条件 - 对于 Column5 中的 NaN 和非 NaN,最后通过 | 链接它们(或者):

m1 = df['Column1'].duplicated(keep=False) & df['Column5'].isnull()
m2 = df['Column5'].duplicated(keep=False) & df['Column5'].notnull()

df = df[m1 | m2]
print (df)
Index Column1 Column2 Column3 Column4 Column5
0 0 1234 500 NEWYORK NY NaN
2 2 1234 300 NEWYORKCITY NY NaN
3 3 8910 235 RICHMOND FL 8.484884e+09
4 4 8910 250 AUSTIN TX 8.484884e+09

详细信息:

print (m1)
0 True
1 False
2 True
3 False
4 False
5 False
dtype: bool

print (m2)
0 False
1 False
2 False
3 True
4 True
5 False
Name: Column5, dtype: bool

关于python - 如何从 pandas 数据框中选择相同的行以及 null,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47262654/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com