gpt4 book ai didi

python - 动态日期差异计算 Pandas

转载 作者:行者123 更新时间:2023-12-01 09:41:44 27 4
gpt4 key购买 nike

 customer_id    Order_date 
1 2015-01-16
1 2015-01-19
2 2014-12-21
2 2015-01-10
1 2015-01-10
3 2018-01-18
3 2017-03-04
4 2019-11-05
4 2010-01-01
3 2019-02-03

假设我有这样的数据

基本上对于电子商务公司,有些人定期购买,有些人每年购买一次,有些人每月购买一次等。我需要找出每个客户每次交易频率之间的差异。

这将是一个动态列表,因为有些人会交易一千次,有些人会交易一次,有些人会交易十次等等。关于如何实现这一点的任何想法。

需要输出:

   customer_id  Order_date_Difference_in_days 
1 6,3 #Difference b/w first 2 dates 2015-01-10 and 2015-01-16
#is 6 days and diff b/w next 2 consecutive dates is
#2015-01-16 and 2015-01-19 is #3 days
2 20
3 320,381
4 3596

基本上这些是针对每个客户 ID 对日期进行排序后的日期之间的差异

最佳答案

您也可以将以下内容用于当前输出:

m=(df.assign(Diff=df.sort_values(['customer_id','Order_date'])
.groupby('customer_id')['Order_date'].diff().dt.days).dropna())

m=m.assign(Diff=m['Diff'].astype(str)).groupby('customer_id')['Diff'].agg(','.join)

customer_id
1 6.0,3.0
2 20.0
3 320.0,381.0
4 3595.0
Name: Diff, dtype: object

关于python - 动态日期差异计算 Pandas,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59479197/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com