gpt4 book ai didi

python - 对于数据框,按变量分组,排序,然后消除不连续的行

转载 作者:行者123 更新时间:2023-12-04 03:24:37 32 4
gpt4 key购买 nike

我有以下数据框:

<表类="s-表"><头>类别值id<正文>汽车宝马1汽车福特9汽车奔驰2汽车保时捷3汽车总经理16汽车特斯拉19循环3T3循环比安奇19循环炼金术4循环安琪儿5循环坎农代尔16循环科尔纳戈22

我希望:

  • 类别分组
  • id对每个组排序
  • 消除数据框中id不连续的行

因此,预期的输出将是:

<表类="s-表"><头>类别值id<正文>汽车宝马1汽车奔驰2汽车保时捷3循环3T3循环炼金术4循环安琪儿5

最佳答案

试试这个,它根据类别和 ID 对值进行排序,然后计算每个类别的差异并只保留连续的值:

c = df.sort_values(['category','id']).groupby("category")['id'].diff().fillna(1).eq(1)
out = df[c.reindex(df.index)]

print(out)

category value id
0 car bmw 1
2 car mercedes 2
3 car porsche 3
6 cycle 3T 3
8 cycle Alchemy 4
9 cycle Ancheer 5

关于python - 对于数据框,按变量分组,排序,然后消除不连续的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67841259/

32 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com