gpt4 book ai didi

python - 在 Pandas 数据框中连接多索引信息

转载 作者:太空宇宙 更新时间:2023-11-04 02:56:40 24 4
gpt4 key购买 nike

我有一个如下所示的多索引数据框:

       col1 col2 col3 col4
row1 0 A A b b
1 B B c c
row2 0 A B d d
1 B B e e

并想知道连接信息的最有效方式,例如对于 row1+col1、row1+col2 等,我的结果将是:

              col1  col2  col3  col4
row1 AB AB bc bc
row2 AB BB de de

到目前为止,我能看到的最好/唯一的方法是:

dx = pd.concat(
[df[col].unstack().apply(lambda row: row.str.cat(sep=''),axis=1)
for col in df.columns],
axis=1,
)

dx.columns = df.columns

在实践中,这个特定数据框的大小为 150 万行乘以 1000 列,因此非常欢迎一种更有效的遍历它的方法!

最佳答案

字符串是 sum 兼容的,所以这将简单地通过在索引的第一级分组来实现:

df.groupby(level=0).apply(sum)
Out[37]:
col1 col2 col3 col4
row1 AB AB bc bc
row2 AB BB de de

关于python - 在 Pandas 数据框中连接多索引信息,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42142823/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com