- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有以下数据集:
date sales
201201 5
201202 5
201203 5
201204 5
201205 5
201206 5
201207 5
201208 5
201209 5
201210 5
201211 5
201212 5
201301 100
201302 100
我想计算从开始到实际日期 + 12 个月的累计销售额
所以在这里:
date sales expected
201201 5 60
201202 5 160
201203 5 260
201204 5 260
201205 5 260
201206 5 260
201207 5 260
201208 5 260
201209 5 260
201210 5 260
201211 5 260
201212 5 260
201301 100 260
201302 100 260
根据这个问题How to compute cumulative sum of previous N rows in pandas?我尝试过:
df['sales'].rolling(window=12).sum()
但是我正在寻找更像这样的东西:
df['sales'].rolling(window=['unlimited preceding, 11 following']).sum()
最佳答案
使用cumsum
直接感谢shift
通过11
,而不是使用ffill
填写NaN
s 与先前的值:
df['expected'] = df['sales'].cumsum().shift(-11).ffill()
现在:
print(df)
是:
date sales expected
0 201201 5 60.0
1 201202 5 160.0
2 201203 5 260.0
3 201204 5 260.0
4 201205 5 260.0
5 201206 5 260.0
6 201207 5 260.0
7 201208 5 260.0
8 201209 5 260.0
9 201210 5 260.0
10 201211 5 260.0
11 201212 5 260.0
12 201301 100 260.0
13 201302 100 260.0
关于python - Pandas : Cumulative sum with moving window (following and preceding rows),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54287216/
我想像以前使用 Tableau 软件一样使用功率查询进行运行总计。有没有人有想法,提前致谢! 最佳答案 为迟到的答案道歉 - 这个挑战已经困扰了我好几个月了。 论坛和博客上很少有解决方案,但它们似乎都
我有数据 dat <- data.frame(t=1:100,y=rnorm(100),x1=rnorm(100)),x2=rnorm(100)) 其中 t 给出时间点。我想根据前面的时间点在每个时
是否有内置的 pandas 方法来查找两个 pandas 系列之间的累积相关性? 它应该做的是有效地修复 pandas.rolling_corr(data, window) 中窗口的左侧,以便窗口的宽
我有一个连接到 Google Data Studio 的 MySQL 数据库,其中包含“日期”和“新用户”列。 “新用户”列显示每天的新用户数。 我想绘制一张相对于日期的累计用户数的图表。这在电子表格
假设我有一个Java IntStream,是否可以将其转换为具有累积和的IntStream?例如,以 [4, 2, 6, ...] 开头的流应转换为 [4, 6, 12, ...]。 更一般地说,应该
我有一个这样的数组: [30, 10, 4, 3, 3] 我需要将其转换为一个 cumulative% 数组,每个值都是到那里的所有值的总和除以数组中所有值的总和。 在本例中,总数为 50。因此,第一
假设我有一个 Java IntStream,是否可以将其转换为具有累积和的 IntStream?例如,以 [4, 2, 6, ...] 开头的流应转换为 [4, 6, 12, ...]。 更一般地说,
我有一个数据框如下。按time列排序。 输入 - df = data.frame(time = 1:20, grp = sort(rep(1:5,4)),
我是 R 的新手。我不确定如何在 R 中执行以下功能。我可以在 excel 中执行此操作。但无法在 R 中完成。有人可以帮助我吗? 我想得到计数器值达到64后的累加和, 以下是我的数据, x 57 5
我的目标是按日期累计注册用户数 这是我的mysql sql SELECT MONTH( DATE ) AS `month`, COUNT(userid) FROM `stats` WHERE `u
我有一个按月-年字符串属性排序的对象列表。我的对象类定义看起来像 Public class Obj{ String year; Long membercount; Long n
我有一个像这样的向量 v <- c(76, 31, 33, 7) 并且需要计算其导致的“累积差” cumdiff <- c(45, 12, 5) 这是 76 - 31 = 45 和 45 - 33 =
假设我有一个奖项的 SQL 表,其中包含日期和金额字段。我需要生成一个表格,其中包含一系列连续日期、每天奖励的金额以及运行(累计)总数。 Date Amount_Total Amo
我们有如下数据框: +------+--------------------+ | Flag | value| +------+--------------------+
我正在计算“第一”位置总计列(下表)的值,并希望使用多个条件来执行此操作。 我希望总“第一”位置能够反射(reflect)特定运动员赢得比赛的次数(截至特定日期)。 例如...见下文,当运动员 = S
我正在计算“第一”位置总计列(下表)的值,并希望使用多个条件来执行此操作。 我希望总“第一”位置能够反射(reflect)特定运动员赢得比赛的次数(截至特定日期)。 例如...见下文,当运动员 = S
我有像这样的一系列累积值: 1821, 2015-01-26 22:14:42+02:00, 24574.7 1822, 2015-01-26 22:15:05+02:00, 24574.7 1823
我试图在二叉索引树 (BIT) 中找到具有给定累积频率的索引。 我能够在 O(log(n)*log(n)) 中解决这个问题,方法是借助二分搜索和计算任何索引处的累积频率的函数来实现它。 但我想在 O(
我是 Python Pandas 的新手,因此无法找到与许多普通 SQL 操作等效的句法。给定玩具场景: id rank ts alive 1 1 201
我想提高我的谷歌页面速度结果。我发现我的主要问题之一是 Cumulative Layout Shift。我意识到这个问题是由 cookie 和促销弹出窗口引起的。 您有任何解决此 google 页面速
我是一名优秀的程序员,十分优秀!