gpt4 book ai didi

python - 当相邻列包含特定值时,如何从数据框中为每个 ID 解析数据?

转载 作者:行者123 更新时间:2023-12-02 16:31:54 26 4
gpt4 key购买 nike

我有一个以下格式的大数据框。我只需要解析出 values ==1 的值和剩余的 id。这应该在每个 ID 上重置,以便它采用包含值 1 的唯一 ID 中的第一个值,并在 ID 号终止时结束。

d={'ID':[1,1,1,1,1,2,2,2,2,2,3,3,3,3,4,4,4,4,4,4,4,4,4,5,5,5,5,5] \
,'values':[0,0,0,1,0,1,0,1,1,1,0,1,0,0,0,0,0,0,1,1,0,1,0,1,1,1,1,1,] }
df=pd.DataFrame(data=d)
df=pd.DataFrame(data=d)
df



ND = {'ID':[1,1,2,2,2,2,2,3,3,3,4,4,4,4,4,5,5,5,5,5],\
'values':[1,0,1,0,1,1,1,1,0,0,1,1,0,1,0,1,1,1,1,1]}


df_final=pd.DataFrame(ND)
df_final

'''

最佳答案

国际工业联合会

df[df.groupby('ID')['values'].transform('cummax')==1]

输出:

    ID  values
3 1 1
4 1 0
5 2 1
6 2 0
7 2 1
8 2 1
9 2 1
11 3 1
12 3 0
13 3 0
18 4 1
19 4 1
20 4 0
21 4 1
22 4 0
23 5 1
24 5 1
25 5 1
26 5 1
27 5 1

详情,使用cummax在第一次找到后保持1的值。然后使用等于 1 创建一个 bool 系列,然后用于进行 bool 索引。

关于python - 当相邻列包含特定值时,如何从数据框中为每个 ID 解析数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63364102/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com