gpt4 book ai didi

python - Pandas Dataframe 多索引按级别和列值排序

转载 作者:行者123 更新时间:2023-11-28 21:42:12 24 4
gpt4 key购买 nike

我有一个 pandas 数据框,如下所示:

                         value
Id
2014-03-13 1 -3
2 -6
3 -3.2
4 -3.1
5 -5
2014-03-14 1 -3.4
2 -6.2
3 -3.2
4 -3.2
5 -5.9

这基本上是一个具有两级多索引的 groupby 对象。

我想根据 value 列对其进行升序排序,但保持 0 级(日期)不变,这样结果应该如下所示:

                         value
Id
2014-03-13 2 -6
5 -5
3 -3.2
4 -3.1
1 -3
2014-03-14 2 -6.2
5 -5.9
1 -3.4
3 -3.2
4 -3.2

这是生成初始数据的代码:

import pandas as pd

dates = [pd.to_datetime('2014-03-13', format='%Y-%m-%d'), pd.to_datetime('2014-03-13', format='%Y-%m-%d'), pd.to_datetime('2014-03-13', format='%Y-%m-%d'), pd.to_datetime('2014-03-13', format='%Y-%m-%d'),
pd.to_datetime('2014-03-13', format='%Y-%m-%d'),pd.to_datetime('2014-03-14', format='%Y-%m-%d'), pd.to_datetime('2014-03-14', format='%Y-%m-%d'), pd.to_datetime('2014-03-14', format='%Y-%m-%d'),
pd.to_datetime('2014-03-14', format='%Y-%m-%d'), pd.to_datetime('2014-03-14', format='%Y-%m-%d')]

values = [-3,-6,-3.2,-3.1,-5,-3.4,-6.2,-3.2,-3.2,-5.9]
Ids = [1,2,3,4,5,1,2,3,4,5]
df = pd.DataFrame({'Id': pd.Series(Ids, index=dates),
'value': pd.Series(values, index=dates)})

df = df.groupby([df.index,'Id']).sum()

最佳答案

我的作品reset_index + sort_values + set_index + rename_axis :

df = df.reset_index() \
.sort_values(['level_0','value']) \
.set_index(['level_0','Id']) \
.rename_axis([None, 'Id'])
print (df)
value
Id
2014-03-13 2 -6.0
5 -5.0
3 -3.2
4 -3.1
1 -3.0
2014-03-14 2 -6.2
5 -5.9
1 -3.4
3 -3.2
4 -3.2

另一种解决方案 sort_values + swaplevel + sort_index :

df = df.sort_values('value')
.swaplevel(0,1)
.sort_index(level=1, sort_remaining=False)
.swaplevel(0,1)
print (df)
value
Id
2014-03-13 2 -6.0
5 -5.0
3 -3.2
4 -3.1
1 -3.0
2014-03-14 2 -6.2
5 -5.9
1 -3.4
3 -3.2
4 -3.2

交换关卡是必要的,因为:

print (df.sort_values('value').sort_index(level=0, sort_remaining=False))
value
Id
2014-03-13 1 -3.0
2 -6.0
3 -3.2
4 -3.1
5 -5.0
2014-03-14 1 -3.4
2 -6.2
3 -3.2
4 -3.2
5 -5.9

对于 pandas 0.23.0 是可能的排序 columns and index levels together :

df.index.names = ['level1','level2']
print (df.sort_values(['level1','value']))
value
level1 level2
2014-03-13 2 -6.0
5 -5.0
3 -3.2
4 -3.1
1 -3.0
2014-03-14 2 -6.2
5 -5.9
1 -3.4
3 -3.2
4 -3.2

关于python - Pandas Dataframe 多索引按级别和列值排序,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44021724/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com