gpt4 book ai didi

python - Pandas :从带有字符串标题的列中删除某些值

转载 作者:太空宇宙 更新时间:2023-11-04 03:01:11 25 4
gpt4 key购买 nike

假设我有以下数据框df:

        First C        Second C       Third C
0 0.104000 0.864000 -999
1 0.060337 0.812470 -999
2 0.065797 0.819570 0.802607
3 0.064715 0.817212 0.801755

我想删除前两行,因为 Third C 列显示了两个奇怪的值。

df = df.drop(df[df.('Third C') == -999].index)

抛出:

       df = df.drop(df[df.('Third C') == -999].index)
^
SyntaxError: invalid syntax

如果我使用带方括号的 df.['Third C'] 也会发生同样的事情。如何在不重命名列的情况下执行此操作?

最佳答案

仅使用 [] 并删除 :

df = df.drop(df[df['Third C'] == -999].index)

但是最好用boolean indexing :

df = df[df['Third C'] != -999]

时间:

drop 解决方案较慢,因为它使用了 bool 索引drop:

In [204]: %timeit (df.drop(df[df['Third C'] == -999].index))
1000 loops, best of 3: 691 µs per loop

In [205]: %timeit (df[df['Third C'] != -999])
1000 loops, best of 3: 359 µs per loop

关于python - Pandas :从带有字符串标题的列中删除某些值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40867977/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com