gpt4 book ai didi

python - 如何根据另一列中的值减去 df 中的行

转载 作者:太空宇宙 更新时间:2023-11-03 14:45:09 24 4
gpt4 key购买 nike

我正在尝试根据其他列的值计算某些行的差异。

使用下面的示例数据框,我想根据 Code 列中的值计算 Time 的差异。具体来说,我想遍历并确定 BA 之间的时间差。所以 B 中的时间 - A 中的时间。

我可以使用 iloc 函数手动执行此操作,但我希望确定一种更有效的方法。特别是如果我不得不多次重复这个过程。

import pandas as pd
import numpy as np

k = 5
N = 15

d = ({'Time' : np.random.randint(k, k + 100 , size=N),
'Code' : ['A','x','B','x','A','x','B','x','A','x','B','x','A','x','B']})

df = pd.DataFrame(data=d)

输出:

   Code  Time
0 A 89
1 x 39
2 B 24
3 x 62
4 A 83
5 x 57
6 B 69
7 x 10
8 A 87
9 x 62
10 B 86
11 x 11
12 A 54
13 x 44
14 B 71

预期输出:

     diff
1 -65
2 -14
3 -1
4 17

最佳答案

首先按 boolean indexing 过滤, 然后减去 subreset_index对于对齐系列 ab 的默认索引,最后如果想要一列 DataFrame 添加 to_frame :

a = df.loc[df['Code'] == 'A', 'Time'].reset_index(drop=True)
b = df.loc[df['Code'] == 'B', 'Time'].reset_index(drop=True)

类似的替代解决方案:

a = df.loc[df['Code'] == 'A'].reset_index()['Time']
b = df.loc[df['Code'] == 'B'].reset_index()['Time']

c = b.sub(a).to_frame('diff')
print (c)
diff
0 -65
1 -14
2 -1
3 17

1 开始的新索引的最后添加 rename:

c = b.sub(a).to_frame('diff').rename(lambda x: x + 1)
print (c)
diff
1 -65
2 -14
3 -1
4 17

如果需要计算更多差异,另一种方法是通过 unstack reshape :

df = df.set_index(['Code', df.groupby('Code').cumcount() + 1])['Time'].unstack()
print (df)
1 2 3 4 5 6 7
Code
A 89.0 83.0 87.0 54.0 NaN NaN NaN
B 24.0 69.0 86.0 71.0 NaN NaN NaN
x 39.0 62.0 57.0 10.0 62.0 11.0 44.0

#last remove `NaN`s rows
c = df.loc['B'].sub(df.loc['A']).dropna()
print (c)
1 -65.0
2 -14.0
3 -1.0
4 17.0
dtype: float64

#subtract with NaNs values - fill_value=0 return non NaNs values
d = df.loc['x'].sub(df.loc['A'], fill_value=0)
print (d)
1 -50.0
2 -21.0
3 -30.0
4 -44.0
5 62.0
6 11.0
7 44.0
dtype: float64

关于python - 如何根据另一列中的值减去 df 中的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50127638/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com