gpt4 book ai didi

python - Pandas DataFrame 在 groupby 之后添加列

转载 作者:太空宇宙 更新时间:2023-11-03 14:49:02 26 4
gpt4 key购买 nike

我有以下 csv 文件:

type    sku quantity    country account
Order CHG-FOOD1COMP-CA 1 usa hch
Order CHG-FOOD2COMP-CA 1 usa hch
Order CHG-FOOD2COMP-CA 1 usa hch
Order CHG-FOOD1COMP-CA 1 usa hch
Order CHG-FOODCONT1-CA 1 usa hch
Order usa hch
Order Q7-QDH0-EBB5-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order Q7-QDH0-EBB5-CA 1 usa hch
Order Q7-QDH0-EBB5-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order CB-BB-CLR12-CA 1 usa hch
Order CB-BB-AMB12-CA 1 usa hch

Order usa hch
Order CB-BB-AMB12-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order CB-BB-CLR12-CA 1 usa hch
Order CHG-FRY-12PT5-CA 1 usa hch
Order CHG-FOODCONT1-CA 1 usa hch
Refund CHG-FRY-9PT5-CA 1 usa hch
Order CHG-FOOD1COMP-CA 1 usa hch

我有以下数据。我想获取每个 sku 的总数量。

SQL: Select sku sum(quantity) As TotalQty,  country, account
From (usa_chc_Date.csv)
group by sku,...

我不介意先获取总和,然后添加那些始终相同的国家/帐户列。我的目的是将信息存储在这些 csv 中,以便它们很容易加载到 django 中,然后删除文件。这就是我正在寻找的:

sku   TotalQty country account
sku1 7 mx chc
sku3 4 mx chc
sku4 2 mx chc
sku5 1 mx chc
sku6 7 mx chc
sku7 9 mx chc

我还命名了该文件以包含国家/地区/帐户信息。我想我可以使用该文件,并在保存模型时删除国家/地区和帐户。

旁注 - 帐户不会更改,因为它们位于同一报告中。加载后,它们的 sku 可以有重复项,但它们有不同的国家/地区。

我试过这个:

 df = df.groupby(['sku','quantity']).sum()

最佳答案

您在错误的列上使用了 pd.groupby

您的问题表明“国家/地区”和“帐户”对于所有“sku”都是相同的。在这种情况下,您应该使用:

df.groupby(['sku', 'country', 'account'], as_index=False).quantity.sum()
Out []:
sku country account quantity
0 CB-BB-AMB12-CA usa hch 2
1 CB-BB-CLR12-CA usa hch 2
2 CHG-FOOD1COMP-CA usa hch 3
3 CHG-FOOD2COMP-CA usa hch 2
4 CHG-FOODCONT1-CA usa hch 2
5 CHG-FRY-12PT5-CA usa hch 4
6 CHG-FRY-9PT5-CA usa hch 1
7 Q7-QDH0-EBB5-CA usa hch 3

注意:我从您的示例中删除了两行,其中没有“sku”也没有“数量”。如果这些情况应该处理,只需在评论中告诉即可。

关于python - Pandas DataFrame 在 groupby 之后添加列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46022401/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com