gpt4 book ai didi

python - Pandas 中大量列的Groupby

转载 作者:行者123 更新时间:2023-12-05 06:21:06 24 4
gpt4 key购买 nike

我正在尝试循环遍历 pandas 中的多个 excel 文件。文件的结构非常相似,前 10 列构成一个键,其余列具有值。我想按前 10 列分组并对其余列求和。

我已经在网上搜索并找到了类似案例的解决方案,但我的问题是

  • 我有大量带有值的列(要汇总为总和)和

  • 每个列的数量/名称(带有值)都不同文件(数据框)

    #Key 列在所有文件中都相同。

我不能分享实际的数据样本,但这是文件结构的格式样本

enter image description here

这是上述数据的期望输出

enter image description here

它类似于 groupby 操作,但是不确定的大量列和标题名称使得使用 groupby 或 pivot 变得困难。任何人都可以建议我在 python 中最好的解决方案是什么。

已编辑:

df.groupby(列表(df.columns[:11])).agg(sum)

正在运行,但由于某种原因需要 25-30 分钟。同样的事情 MS Access 在 1-2 分钟内完成。我在这里做错了什么还是有其他方法可以在 python 中做这件事

最佳答案

只需使用包含列列表的 df.columns,然后您可以在该列表上使用切片来获取最左边的 10 列。

这应该有效:

df.groupby(df.columns[:10].to_list()).sum()

关于python - Pandas 中大量列的Groupby,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60123947/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com