gpt4 book ai didi

python - pandas 的增量计数

转载 作者:行者123 更新时间:2023-12-01 02:04:09 25 4
gpt4 key购买 nike

我有如下数据集。并希望通过 C1 获取 C2 组的计数,如下所示。

C1  C2
a 1
a 2
a 3
a 4
a 5
b 1
b 2
b 3
b 4
b 5
b 6
c 6
c 7

预期结果如下。 b 的计数应该是 a 中不存在的项目。与c相同,即不存在于ab

a   5
b 1
c 1

我可以在 pandas 中使用任何逻辑来实现这一点吗?除了遍历记录之外

最佳答案

您可以删除 'C2' 列上的重复项并计算 'C1' 上留下的值:

print(df.drop_duplicates('C2')['C1'].value_counts())
# a 5
# b 1
# c 1
# Name: C1, dtype: int64

输出将是一个系列。如果您想要数据框,可以使用 to_frame:

df = df.drop_duplicates('C2')['C1'].value_counts().to_frame()
print(df)
# C1
# a 5
# b 1
# c 1

警告

  • value_counts 默认对输出进行排序。在这种情况下,这没有什么区别,但您可以传递 sort=False ,这样行(索引)将保持与原始数据帧中相同的顺序。

关于python - pandas 的增量计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49231120/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com