python - Pandas - 自上次交易以来的计数-6ren

python - Pandas - 自上次交易以来的计数

转载作者：行者123 更新时间：2023-11-28 22:16:02

25

4

我有一个包含货币交易记录的数据框(称之为 txn_df)，以下是此问题中的重要列:

txn_year    txn_month   custid  withdraw    deposit
2011        4           123     0.0         100.0
2011        5           123     0.0         0.0
2011        6           123     0.0         0.0
2011        7           123     50.1        0.0
2011        8           123     0.0         0.0

还假设我们这里有多个客户。 withdraw 和 deposit 两者的值都为 0.0 表示没有发生任何交易。我想要做的是生成一个新列，指示自发生交易以来已经发生了多少个月。类似这样的东西:

txn_year    txn_month   custid  withdraw    deposit     num_months_since_last_txn
2011        4           123     0.0         100.0       0
2011        5           123     0.0         0.0         1
2011        6           123     0.0         0.0         2           
2011        7           123     50.1        0.0         3
2011        8           123     0.0         0.0         1

到目前为止，我能想到的唯一解决方案是在 withdraw 和 deposit 的值 > 0.0，但我无法从那里继续。

最佳答案

解决这个问题的一种方法，

df['series'] =  df[['withdraw','deposit']].ne(0).sum(axis=1)
m = df['series']>=1

正如@Chris A 评论的那样，

m = df[['withdraw','deposit']].gt(0).any(axis=1) #replacement for above snippet,

df['num_months_since_last_txn'] = df.groupby(m.cumsum()).cumcount()
df.loc[df['num_months_since_last_txn']==0,'num_months_since_last_txn']=(df['num_months_since_last_txn']+1).shift(1).fillna(0)
print df

输出:

   txn_year  txn_month  custid  withdraw  deposit
0      2011          4     123       0.0    100.0
1      2011          5     123       0.0      0.0
2      2011          6     123       0.0      0.0
3      2011          7     123      50.1      0.0
4      2011          8     123       0.0      0.0
   txn_year  txn_month  custid  withdraw  deposit  num_months_since_last_txn
0      2011          4     123       0.0    100.0                        0.0
1      2011          5     123       0.0      0.0                        1.0
2      2011          6     123       0.0      0.0                        2.0
3      2011          7     123      50.1      0.0                        3.0
4      2011          8     123       0.0      0.0                        1.0

解释:

要确定交易是否发生，请使用 ne 和求和以获取二进制值。
当事务为 1 时，使用 groupby、cumsum、cumcount 从 0,1,2...n 创建系列。
使用 .loc 重新排列 0 的值>

注意:可能是我添加了更复杂的内容来解决这个问题。但它会给你一个想法和方法来解决这个问题。

考虑客户ID的解决方案，

df=df.sort_values(by=['custid','txn_month'])
mask=~df.duplicated(subset=['custid'],keep='first')
m = df[['withdraw','deposit']].gt(0).any(axis=1)
df['num_months_since_last_txn'] = df.groupby(m.cumsum()).cumcount()
df.loc[df['num_months_since_last_txn']==0,'num_months_since_last_txn']=(df['num_months_since_last_txn']+1).shift(1)
df.loc[mask,'num_months_since_last_txn']=0

示例输入:

   txn_year  txn_month  custid  withdraw  deposit
0      2011          4     123       0.0    100.0
1      2011          5     123       0.0      0.0
2      2011          4    1245       0.0    100.0
3      2011          5    1245       0.0      0.0
4      2011          6     123       0.0      0.0
5      2011          7    1245      50.1      0.0
6      2011          7     123      50.1      0.0
7      2011          8     123       0.0      0.0
8      2011          6    1245       0.0      0.0
9      2011          8    1245       0.0      0.0

示例输出:

   txn_year  txn_month  custid  withdraw  deposit  num_months_since_last_txn
0      2011          4     123       0.0    100.0                        0.0
1      2011          5     123       0.0      0.0                        1.0
4      2011          6     123       0.0      0.0                        2.0
6      2011          7     123      50.1      0.0                        3.0
7      2011          8     123       0.0      0.0                        1.0
2      2011          4    1245       0.0    100.0                        0.0
3      2011          5    1245       0.0      0.0                        1.0
8      2011          6    1245       0.0      0.0                        2.0
5      2011          7    1245      50.1      0.0                        3.0
9      2011          8    1245       0.0      0.0                        1.0

考虑客户 ID 的说明，

以上代码基于 [1,1] 之间的区间工作。因此，要制作相同的格式，请按 cust_id 和 txn_month 对 df 进行排序，将来您可以添加 txn_year。
fillna(0)，不会在这里工作，因为 shift 不会为下一个客户创建 NaN。重置为 0 查找重复的客户 ID 并将第一个值替换为 0。

关于python - Pandas - 自上次交易以来的计数，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52494999/

25

4

0

文章推荐： java - 在 tomcat v 8.5 上部署 spring boot 应用程序失败

MongoDB和HBase的一致性区别？交易？
我听过很多次公司喜欢HBase的强一致性。我阅读了 HBase 并喜欢它。然后我想到了mongodb write和那时候的区别。查了一下MongoDB似乎也有很强的一致性。但它是一致的吗？看起来 HB
区块链入门③-交易
区块链入门 ③ - 交易交易概述比特币交易本质上包含交易参与者价值转移的相关信息数据结构。比特币区块链是一本全球复式记账总账簿，每笔交易都是在比特币区块链上的一个公开记录.
java - 如何知道回滚已经执行了？ [@交易]
我有以下情况: 我正在迭代我的Affiliate 实体，对于每个实体，我需要在一个唯一的事务中保存和更新数据。因此，我有一个服务，其方法用 Spring @Transactional 注释(其中创建和
transactions - ORMLite + 交易
我无法理解 DaoManager 的默认行为。 DaoManager.createDao(connectionSource, theClass); 这需要一个 connectionSource - 而
java - Spring 交易
我是 Spring 新手，有一个关于事务的问题。我知道对于每个 http 请求都有一个 servlet 线程，它有自己的堆栈。据我所知，所有局部变量和方法都驻留在堆栈上。因此，如果我有一个方法 pu
Java，使用队列管理器进行大规模消息处理(交易)
我想设计一个简单的应用程序(没有 j2ee 和 jms)，可以处理大量消息(比如在交易系统中) 我创建了一个服务，可以接收消息并将它们放入队列中，这样系统就不会在过载时卡住。然后我创建了一个包装队列
mysql - PDO 交易？
如果使用 PDO 事务，是否需要锁定表？如果用户 a 有 50 笔钱，将 50 笔转给用户 b，PDO 交易是否会确保它们都无误地执行？另外，如果说我有一个 if 语句， if ($user['m
java - POJO 交易
我正在实现一个方法，它会做类似的事情: ... try { myPojo.setProperty("foo"); myService.execute(myPojo); } catch (E
mysql - rails 交易
我正在尝试使用 ActiveRecord::Base.transaction。我认为使用 Rails 1.2.6 和 mysql 5.0 默认情况下回滚不起作用。多玩一点我发现 autocommit
俄罗斯卢布的 PayPal 交易
我在我的网站上使用嵌入式支付，支付交易直接从买家到卖家发起，服务充当 API 调用方。商品价格由卖家以美元设定，以简化国际贸易。当发件人和收件人都是俄罗斯居民时，发件人会收到错误消息: The pa
iOS收据不包含 repo 交易
如果我删除我的应用程序中的数据，然后重新购买一些我知道该帐户已经拥有的托管 IAP，iOS 会给我原生的“您确定要重新购买该项目吗？您不会被收取费用”对话框。这符合预期。当购买返回到我的应用程序时，
java - JOOQ & 交易
我一直在阅读 transactions & jooq但我很难看到如何在实践中实现它。假设我为 JOOQ 提供了一个自定义 ConnectionProvider，它恰好使用了一个自动提交设置为 fal
c# - 无法访问已处置的对象。交易
我们正在使用 Entity Framework 并在事务范围内运行单元测试。我们最初在标题中遇到错误。我已经设法将问题隔离开来。 using (TransactionScope scope1 = n
PHP PDO 交易？
我有一个注册页面，基本上我需要将数据插入到 4 个表中。我是 PDO 的新手，对某些事情感到困惑。基本上，如果任何插入失败，我不想向数据库中添加任何内容，这看起来很简单。我的困惑是，我需要首先在我
pivot - 交易 View 图表松树编辑器中指标的自动缩放禁用
我使用枢轴点进行交易。我在屏幕指示器上使用以下指标“CM_Pivots_Filtered”、“Pivots”、“CD_PivotR”和“CM_Gaps_Intra-Day_V2.1”。这些枢轴工作得很
java - Sonar 问题 - 交易
我正在努力解决 Sonar 问题: squid:S2229 "Methods should not call same-class methods with incompatible "@Transa
ruby-on-rails - 如何回滚Rails保存/交易？
在我的 Controller 中，我有一些类似的代码... ... if user.save something = Something.where("thing = ?", thing)
iphone - 处理已取消的 IAP 交易
我使用 StoreKit 进行应用内购买。我发现当用户按下“取消”按钮时，API 的行为很奇怪。例如，如果我在“确认您的应用内购买”屏幕上按“取消”，我会收到一个带有 error.code == S
iphone - 自动续订订阅在自动续订时是否会发送 SKPaymentTransactionStatePurchased 交易？
AppStore 在自动续订自动续订订阅时是否会发出交易？如果是这样，如果应用程序将自己设置为观察者，那么下次应用程序加载时是否可以可靠地检测到它: [[SKPaymentQueue defaultQ
terminal - 终端与发行人之间的通信 - EMV 交易
我正在研究 EMV 技术，并寻找终端和发行者之间的通信(请求/响应)以进行授权/在线 PIN 检查。我知道离线数据验证仅在终端上进行检查，然后终端将数据发送给发行者。我想知道授权过程需要发送哪些数据

首页

博学

6Ren·AI

商城

python - Pandas - 自上次交易以来的计数