python - GroupBy 中的 Pandas 累计和-6ren

python - GroupBy 中的 Pandas 累计和

转载作者：太空宇宙更新时间：2023-11-03 14:03:10

我有一个时间序列数据，其中包含特定时间的符号及其各自的值。

index,symbol,value
01:00,A,10
01:00,B,15
01:01,A,15
01:01,B,25
01:02,A,30
01:02,B,45

现在我想创建一个第 4 列，它具有每个交易品种基于时间序列的累积值，但是从每个累积行中，每个交易品种的第一行值将分别减去

index,symbol,value,adjustedCumulativeSum
01:00,A,10,0
01:00,B,15,0
01:01,A,15,15
01:01,B,25,25
01:02,A,30,45
01:02,B,45,70

我知道如何做正常的累加和

df = df.reset_index().sort_values(['index','symbol'])
df['cumlativesum'] = df.groupby('symbol')['value'].cumsum()
df = df.set_index('index')

但是我是否要从所有累计总和中扣除第 0 行的值？

最佳答案

使用groupby带有自定义函数 cumsum并减去 iat 选择的第一个值:

df['adjustedCumulativeSum']=df.groupby('symbol')['value'].apply(lambda x:x.cumsum()-x.iat[0])
print (df)
   index symbol  value  adjustedCumulativeSum
0  01:00      A     10                      0
1  01:00      B     15                      0
2  01:01      A     15                     15
3  01:01      B     25                     25
4  01:02      A     30                     45
5  01:02      B     45                     70

关于python - GroupBy 中的 Pandas 累计和，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46991167/

文章推荐： ssl - 将 www 重定向到非 www

文章推荐： c# - asp.net 控件的 OnClick 事件

文章推荐： python - 任何人都可以看到我的代码中的缺陷吗？

文章推荐： ssl - 通过 Tornado 使用代理尝试蜘蛛，发生 SSL 错误

sql - 与前几个月建立表格(累计)
我对以下需要使用 SQL 查询而不是 plsql 来解决的问题感到困惑。这个想法是建立一个累积列来计算之前的所有月份。输入表看起来像 Month 1 2 3 .. 24 我需要建立下表:
r - 在子组内使用单一、通用的特定于组的基线进行计算(累计)
我正在寻找一个整洁的解决方案，最好使用 tidyverse 这个问题符合this answer ，但它确实有一个额外的扭曲。我的数据有一个整体分组变量“grp”。在每个这样的组中，我想根据“试验”定义
sum - Spotfire 运行余额(累计)
我正在尝试在 Spotfire 中创建一个运行余额列，该列应该如下图所示。本质上，我想逐行计算“金额”列的累积总计，并且我希望它随着日期的变化从 0 开始。我尝试过几个 OVER 函数:Sum([A

太空宇宙

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

python - GroupBy 中的 Pandas 累计和