gpt4 book ai didi

python - 根据自定义要求 reshape 数据框

转载 作者:行者123 更新时间:2023-12-01 10:18:10 24 4
gpt4 key购买 nike

我有一个如下所示的数据框:

    Node ID11 ID10  ID9 ID8 ID7 ID6 ID5 ID4 ID3 ID2 ID1 ID0
0 YYZ 1 2 3 NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 DFW 4 5 6 7 NaN NaN NaN NaN NaN NaN NaN NaN
2 DEN 20 21 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
3 BOS 100 101 102 103 104 105 106 NaN NaN NaN NaN NaN

我想重新塑造它,使最终结果看起来像:

    Node num1 num2
0 YYZ 3 2
1 YYZ 3 1
2 DFW 7 6
3 DFW 7 5
4 DFW 7 4
5 DEN 21 20
6 BOS 106 105
7 BOS 106 104
8 BOS 106 103
9 BOS 106 102
10 BOS 106 101
11 BOS 106 100

基本上,节点一行中的最后一个非 nan ID 进入第一列,然后每个其他 ID 进入第二列,并进入同一节点的后续行。

我一直在研究 Pandas 中内置的函数(堆叠/取消堆叠),但到目前为止还无法正确调整它。我的实际数据框很大,所以现在只玩一个测试框。

最佳答案

使用:

#change order of columns for change ordering of final value column
df = df[df.columns[::-1]]

#reshape by stack
df = (df.set_index('Node')
.stack()
.rename_axis(('Node','num1'))
.astype(int)
.reset_index(name='num2'))

#get last non NaN value to num1 column
df['num1'] = df.groupby('Node')['num2'].transform('first')
#remove last row per groups
df = df[df.duplicated(subset=['Node'])].copy()
print (df)
Node num1 num2
1 YYZ 3 2
2 YYZ 3 1
4 DFW 7 6
5 DFW 7 5
6 DFW 7 4
8 DEN 21 20
10 BOS 106 105
11 BOS 106 104
12 BOS 106 103
13 BOS 106 102
14 BOS 106 101
15 BOS 106 100

关于python - 根据自定义要求 reshape 数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58936443/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com