gpt4 book ai didi

python - 如何从每个一级指标中最大的二级指标的单元格中取值?

转载 作者:太空宇宙 更新时间:2023-11-04 09:34:35 25 4
gpt4 key购买 nike

我有以下数据框,我现在希望创建一个附加列来包含每列火车的目的地 (ziel)(作为第一级行索引 zug_nr) ,它已经在 an_bf 列中作为每列火车的最后一站(作为第二级行索引 bf)。

但是,使用 groupby 没有帮助

df9['ziel'] = df9['an_bf'].groupby(level = 0, axis = 0).max()
df9.head()

an_zeit an_bf sorte ab_zeit ziel
zug_nr bf
IC 2309 0 1900-01-01 00:11:00 Duisburg Hbf IC 1900-01-01 00:00:00 NaN
1 1900-01-01 00:25:00 Düsseldorf Hbf IC 1900-01-01 00:00:00 NaN
2 1900-01-01 00:49:00 Köln Hbf IC 1900-01-01 00:00:00 NaN
ICE 100 0 1900-01-01 00:13:00 Bochum Hbf ICE 1900-01-01 00:04:00 NaN
1 1900-01-01 00:26:00 Dortmund Hbf ICE 1900-01-01 00:04:00 NaN

这是我希望的样子:

             an_zeit            an_bf           sorte  ab_zeit     ziel
zug_nr bf
IC 2309 0 1900-01-01 00:11:00 Duisburg Hbf IC 1900-01-01 00:00:00 Köln Hbf
1 1900-01-01 00:25:00 Düsseldorf Hbf IC 1900-01-01 00:00:00 Köln Hbf
2 1900-01-01 00:49:00 Köln Hbf IC 1900-01-01 00:00:00 Köln Hbf
ICE 100 0 1900-01-01 00:13:00 Bochum Hbf ICE 1900-01-01 00:04:00 Dortmund Hbf
1 1900-01-01 00:26:00 Dortmund Hbf ICE 1900-01-01 00:04:00 Dortmund Hbf

提前感谢您的建议!

最佳答案

使用GroupBy.lastGroupBy.transform :

#if datetimes are not sorted by an_zeit column
#df9 = df9.sort_values('an_zeit', ascending=False)

df9['ziel'] = df9.groupby(level=0)['an_bf'].transform('last')

#sorting MultiIndex if necessary
#df9 = df9.sort_index()

关于python - 如何从每个一级指标中最大的二级指标的单元格中取值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54269558/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com