gpt4 book ai didi

python - 如何在 Python 中聚合某些列,同时保留其他列

转载 作者:太空宇宙 更新时间:2023-11-03 20:36:46 26 4
gpt4 key购买 nike

我有一个包含>100个变量的数据集,但为了说明问题,我将其简化如下。

enter image description here

我想要groupby() colAcolBsum() colD,同时采用不同的值 colCcolE

我尝试了如下的操作,但正如你所知,这只会返回我分组的列和我求和的列,并且永远不会返回 colCcolE

方法1:df.groupby(['colA','colB').aggregate({'colC': sum})

方法2:我可以像上面那样聚合它们,然后将其连接到同一个表以获得结果。

approach3: 将所有列都归入 groupby,但是当我这样做时,我无法对 Missing 的值进行分组,就像您在 colE 中看到的那样

我有什么选择?

更正更新:我刚刚更正了之前提供数据的方式,它是不正确的

data = [
["25-5-19", "cat1", "cat3", 10, 1],
["25-5-19", "cat1", "cat3", 20, 1],
["25-5-19", "cat1", "cat3", 30, 1],
["26-5-19", "cat2", "cat4", 50, 2],
["26-5-19", "cat2", "cat4", 100, 2],
["26-5-19", "cat2", "cat4", 10, 2],
["27-5-19", "cat1", "cat5", 40, None],
["27-5-19", "cat1", "cat5", 60, None]
]

`

最佳答案

看来你需要

df['New']=df.groupby(['colA','colB'])['colC'].transform('sum')

关于python - 如何在 Python 中聚合某些列,同时保留其他列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57114684/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com