gpt4 book ai didi

python - 识别 Pandas 数据框中并发事件的简单方法

转载 作者:太空宇宙 更新时间:2023-11-04 04:08:22 26 4
gpt4 key购买 nike

我正在寻找一种简单的方法来向数据框添加一列,以指示给定零件是否已连续购买至少两年

这是一个示例数据框

df = pd.DataFrame(
{
'PART_UNIT':['A','A','A','B','B'],
'FiscalYear':['2015/2016','2016/2017','2018/2019','2015/2016','2017/2018'],
'PO_UNIT_PRICE':[10,12,11,45,54]
}
)
print(df)

0 A 2015/2016 10
1 A 2016/2017 12
2 A 2018/2019 11
3 B 2015/2016 45
4 B 2017/2018 54

我正在寻找一个类似于我在添加标准偏差列时会使用的函数

df['std'] = df.groupby(['PART_UNIT'])['PO_UNIT_PRICE'].transform(np.std)

得到这样的结果

  PART_UNIT FiscalYear  PO_UNIT_PRICE  Concurrent
0 A 2015/2016 10 1
1 A 2016/2017 12 1
2 A 2018/2019 11 1
3 B 2015/2016 45 0
4 B 2017/2018 54 0

如您所见,“B”部分在列中的值为 0,因为它已连续两年未被购买。

最佳答案

import pandas as pd

df = pd.DataFrame(
{
'PART_UNIT': ['A', 'A', 'A', 'B', 'B'],
'FiscalYear': ['2015/2016', '2016/2017', '2018/2019', '2015/2016', '2017/2018'],
'PO_UNIT_PRICE': [10, 12, 11, 45, 54]
}
)

print(df)


def two_years_in_a_row(fiscal_years):
tmp = list(fiscal_years)
for idx, year in enumerate(tmp):
if idx > 0:
if tmp[idx - 1].split('/')[1] == year.split('/')[0]:
return 1
return 0


print('----------------------------------------')

df['concurrent'] = df.groupby(['PART_UNIT'])['FiscalYear'].transform(two_years_in_a_row)

print(df)

输出

 PART_UNIT FiscalYear  PO_UNIT_PRICE
0 A 2015/2016 10
1 A 2016/2017 12
2 A 2018/2019 11
3 B 2015/2016 45
4 B 2017/2018 54
----------------------------------------
PART_UNIT FiscalYear PO_UNIT_PRICE concurrent
0 A 2015/2016 10 1
1 A 2016/2017 12 1
2 A 2018/2019 11 1
3 B 2015/2016 45 0
4 B 2017/2018 54 0

关于python - 识别 Pandas 数据框中并发事件的简单方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56822965/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com