gpt4 book ai didi

python - 如何在 dataframegroup python 中找到具有重复值的组列?

转载 作者:行者123 更新时间:2023-12-05 01:54:47 25 4
gpt4 key购买 nike

首先我有一个 df,当我用一列对它进行分组时,它会删除重复值吗?。其次,如何知道哪个组有重复值(我试图找到如何知道 df 的哪些列有重复值但找不到任何东西,他们只是谈论每个元素如何重复或不重复)

ex i have a df like this:
A B C
1 1 2 3
2 1 4 3
3 2 2 2
4 2 3 4
5 2 2 3

after groupby('A')

A B C
1 2 3
4 3
2 2 2
3 2
2 3

我想知道有多少组A有B重复,有多少组A有C重复

result:
B C
1 1 2

or maybe better can caculate percent

B : 50%
C : 100%

谢谢

最佳答案

您可以在 GroupBy.agg 中使用 lambda 函数比较不等于组中值数量的唯一值数量。要获得独特的数量,我们可以使用 Series.nuniqueSeries.size一组中值的数量。

df.groupby(level=0).agg(lambda x: x.size!=x.nunique())

# B C
# 1 False True
# 2 True False

关于python - 如何在 dataframegroup python 中找到具有重复值的组列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/70546822/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com