gpt4 book ai didi

python - pandas 数据框中多索引第二级的总和值

转载 作者:太空宇宙 更新时间:2023-11-03 20:42:17 31 4
gpt4 key购买 nike

我有一个 pandas DataFrame,其多重索引为 'County ID''County'。有一个“Workforce”列,我需要对该列中的所有值求和,然后将其添加到 DataFrame 中的另一列,但我只需要对每个级别的值。然而,我一直无法让 pandas 以这种方式求和。

我尝试了许多不同的方法,包括创建其他 DataFrame 对每个索引求和,然后重新添加到其他 DataFrame。我也尝试过循环,但无法将列中的所有值相加。

我的数据框如下所示:enter image description here

*COUNTY ID*   *COUNTY*             INDUSTRY  WORKFORCE  TOTAL WORKFORCE
12001 | Alachua County, FL Retail 25329 0
| Alachua County, FL Health 22914 0
8013 | Boulder County, CO Education 24123 0
| Boulder County, CO Finance 19478 0
# And so on in that manner

'TOTAL WORKFORCE' 是我添加为 int64 的虚拟列,以便我可以在其中放置一个数值作为我需要的总和的结果。

我想计算所有劳动力数量,并将每个县的所有劳动力数量加在一起,如下所示:

*COUNTY ID*   *COUNTY*             INDUSTRY  WORKFORCE  TOTAL WORKFORCE
12001 | Alachua County, FL Retail 25329 48243
| Alachua County, FL Health 22914 48243
8013 | Boulder County, CO Education 24123 43601
| Boulder County, CO Finance 19478 43601

任何帮助将非常感谢!

最佳答案

level=0 上的 groupby 并使用 sum 进行转换应该可以:

df['TOTALWORKFORCE'] = df.groupby(level=0).WORKFORCE.transform('sum')

关于python - pandas 数据框中多索引第二级的总和值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56794760/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com