gpt4 book ai didi

python - 如何确定pandas数据框中的切换器和双切换器

转载 作者:行者123 更新时间:2023-11-30 22:29:35 26 4
gpt4 key购买 nike

这是我的数据

user_id channel
1 A
1 A
1 A
2 A
2 B
2 B
2 B
3 A
3 B
3 B
3 A
3 A
4 A
4 B

我需要的是制作可以过滤切换者(至少切换一次的用户)的函数

user_id
2
3
4

并过滤双切换者(至少切换两次的用户)

user_id
3

由于实际数据很大,如果回答者能够概括出下一个切换器的顺序就更好了,谢谢

最佳答案

df.groupby('user_id').apply(
lambda x: np.count_nonzero(x.values[:-1] != x.values[1:])
)

user_id
1 0
2 1
3 2
4 1
dtype: int64
<小时/>

过滤器

df.groupby('user_id').apply(
lambda x: np.count_nonzero(x.values[:-1] != x.values[1:])
).compress(lambda x: x > 0)

user_id
2 1
3 2
4 1
dtype: int64

或者

df.groupby('user_id').apply(
lambda x: np.count_nonzero(x.values[:-1] != x.values[1:])
).compress(lambda x: x > 1)

user_id
3 2
dtype: int64

关于python - 如何确定pandas数据框中的切换器和双切换器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46313613/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com