gpt4 book ai didi

python - 使用 groupby 过滤重复值

转载 作者:太空宇宙 更新时间:2023-11-04 08:24:18 28 4
gpt4 key购买 nike

我正在阅读文档以了解与 groupby 一起使用时的方法过滤器。为了理解它,我有以下场景:

我正在尝试从我的 DataFrame df 中获取按城市分组的重复名称。以下是我的尝试:

df = pd.DataFrame({
'city':['LA','LA','LA','LA','NY', 'NY'],
'name':['Ana','Pedro','Maria','Maria','Peter','Peter'],
'age':[24, 27, 19, 34, 31, 20],
'sex':['F','M','F','F','M', 'M'] })

df_filtered = df.groupby('city').filter(lambda x: len(x['name']) >= 2)

df_filtered

我得到的输出是:

city    name    age sex
LA Ana 24 F
LA Pedro 27 M
LA Maria 19 F
LA Maria 34 F
NY Peter 31 M
NY Peter 20 M

我期望的输出是:

city    name    age sex
LA Maria 19 F
LA Maria 34 F
NY Peter 31 M
NY Peter 20 M

我不清楚在什么情况下我必须在“groupby”方法和“filter”方法中的“len”中使用不同的列名

谢谢

最佳答案

如何复制:

df[df.duplicated(['city', 'name'], keep=False)]

关于python - 使用 groupby 过滤重复值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58867745/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com