gpt4 book ai didi

python - 通过合并更好地替代 groupby

转载 作者:行者123 更新时间:2023-11-28 18:08:56 51 4
gpt4 key购买 nike

<分区>

我想知道是否有人知道我目前正在做的事情的更好方法。这是一个示例数据集:

ID  Number
a 1
a 2
a 3
b 4
c 5
c 6
c 7
c 8

示例:如果我想在上表中按 ID 列获取数字计数。我会先做一个 groupby ID 并对 Number 进行计数,然后将结果合并回原始表,如下所示:

df2 = df.groupby('ID').agg({'Number':'count'}).reset_index()

df2 = df2.rename(columns = {'Number':'Number_Count'})

df = pd.merge(df, df2, on = ['ID'])

这导致:

enter image description here

这感觉像是一种迂回的方式,有人知道更好的选择吗?我问的原因是因为在处理大型数据集时,这种方法会占用大量内存(通过创建另一个表然后合并它们)。

51 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com