- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试在 pandas 中找到一个矢量化解决方案,该解决方案在电子表格中很常见,即在基于实际 cumsum 的结果跳过或设置固定值的情况下进行 cumsum。我有以下内容:
A
1 0
2 -1
3 2
4 3
5 -2
6 -3
7 1
8 -1
9 1
10 -2
11 1
12 2
13 -1
14 -2
我需要添加第二列,其中的总和为“A”,如果其中一个总和为正值,则将其替换为 0,并使用该 0 继续计算总和。同时,如果总和给出了低于 B 列中 0 后记录的 A 列中最低值的负值我需要将其替换为 A 列中的最低值。我知道这是一个很大的问题,但是是否有矢量化解决方案?也许使用辅助列。结果应如下所示:
A B
1 0 0
2 -1 -1 # -1+0 = -1
3 2 0 # -1 + 2 = 1 but 1>0 so this is 0
4 3 0 # same as previous row
5 -2 -2 # -2+0 = -2
6 -3 -3 # -2-3 = -5 but the lowest value in column A since last 0 is -3 so this is replaced by -3
7 1 -2 # 1-3 = -2
8 -1 -3 # -1-2 = -3
9 1 -2 # -3 + 1 = -2
10 -2 -3 # -2-2 = -4 but the lowest value in column A since last 0 is -3 so this is replaced by -3
11 1 -2 # -3 +1 = -2
12 2 0 # -2+2 = 0
13 -1 -1 # 0-1 = -1
14 -2 -2 # -1-2 = -3 but the lowest value in column A since last cap is -2 so this is -2 instead of -3
目前我做了这个,但不是 100% 有效,而且效率也不高:
df['B'] = 0
df['B'][0] = 0
for x in range(len(df)-1):
A = df['A'][x + 1]
B = df['B'][x] + A
if B >= 0:
df['B'][x+1] = 0
elif B < 0 and A < 0 and B < A:
df['B'][x+1] = A
else:
df['B'][x + 1] = B
最佳答案
使用 df['A'].expanding(1).apply(function)
我可以运行自己的 function
首先只得到一行,接下来的 2 行,接下来的 3 行等。我没有给出之前计算的结果,它需要一次又一次地进行所有计算,但它不需要 global
变量和硬编码df['A']
A = [0, -1, 2, 3, -2, -3, 1, -1, 1, -2, 1, 2, -1, -2]
import pandas as pd
df = pd.DataFrame({"A": A})
def function(values):
#print(values)
#print(type(valuse)
#print(len(values))
result = 0
last_zero = 0
for index, value in enumerate(values):
result += value
if result >= 0:
result = 0
last_zero = index
else:
minimal = min(values[last_zero:])
#print(index, last_zero, minimal)
#if result < minimal:
# result = minimal
result = max(result, minimal)
#print('result:', result)
return result
df['B'] = df['A'].expanding(1).apply(function)
df['B'] = df['B'].astype(int)
print(df)
结果:
A B
0 0 0
1 -1 -1
2 2 0
3 3 0
4 -2 -2
5 -3 -3
6 1 -2
7 -1 -3
8 1 -2
9 -2 -3
10 1 -2
11 2 0
12 -1 -1
13 -2 -2
相同但使用普通的 apply()
- 它需要 global
变量和硬编码的 df['A']
A = [0, -1, 2, 3, -2, -3, 1, -1, 1, -2, 1, 2, -1, -2]
import pandas as pd
df = pd.DataFrame({"A": A})
result = 0
last_zero = 0
index = 0
def function(value):
global result
global last_zero
global index
result += value
if result >= 0:
result = 0
last_zero = index
else:
minimal = min(df['A'][last_zero:])
#print(index, last_zero, minimal)
#if result < minimal:
# result = minimal
result = max(result, minimal)
index += 1
#print('result:', result)
return result
df['B'] = df['A'].apply(function)
df['B'] = df['B'].astype(int)
print(df)
同样使用普通的for
-loop
A = [0, -1, 2, 3, -2, -3, 1, -1, 1, -2, 1, 2, -1, -2]
import pandas as pd
df = pd.DataFrame({"A": A})
all_values = []
result = 0
last_zero = 0
for index, value in df['A'].iteritems():
result += value
if result >= 0:
result = 0
last_zero = index
else:
minimal = min(df['A'][last_zero:])
#print(index, last_zero, minimal)
#if result < minimal:
# result = minimal
result = max(result, minimal)
all_values.append(result)
df['B'] = all_values
print(df)
关于python - Cumsum 列,同时跳过行或根据实际 cumsum 的结果在条件上设置固定值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69876970/
我正在尝试在 pandas 中找到一个矢量化解决方案,该解决方案在电子表格中很常见,即在基于实际 cumsum 的结果跳过或设置固定值的情况下进行 cumsum。我有以下内容: A 1 0
假设我有一个距离数组 x=[1,2,1,3,3,2,1,5,1,1]。 我想从 x 中获取索引,其中 cumsum 达到 10,在本例中,idx=[4,9]。 所以 cumsum 在满足条件后重新启动
每当超过给定的 cumsum 阈值时,我需要有关对连续行进行分组的帮助。当超过此阈值时,也应重新启动 cumsum(为零),如下所示: Index Values Regular CumS
我对 python 还很陌生。我尝试对每个客户进行累积总和,以查看相应的不活动月份(标志:1 或 0)。因此,当我们有 0 时,需要重置 1 的累积和。当我们有新客户端时,也需要重置。请参阅下面的示例
我要重置 cumsum在一个向量上,当它达到某个值时。 例如。对于以下向量: v <- c(3, 5, 2, 5, 3, 4, 5, 3, 1, 4) 预期输出为: c(0, 0, 10, 0, 0,
我正在尝试使用reduce函数在python中编写累积和的版本。这是到目前为止我的代码: from functools import reduce def my_cum_sum(arg): r
问题:给定一个二叉搜索树,其中的键是数字,我们将定义操作“cumsum”(累积和的简写),它切换树中每个节点的键所有小于或等于它的键的总和。 例如, 在这个例子中, 根中的键 5 切换为值 10:根中
我是 pandas 的新手,我可以将 cumsum 添加为 df.cumsum(axis=1) y0 y1 y2 0 2 3 4 1 2 2 3 2 0 0
我有一个正数向量,使得 - 如果数字大于或等于 1,则相加 - 如果数字小于 1,则乘以累积和。 例如 > set.seed(0) > x x [1] 3.0 0.9 0.9 1.0 3.0 0.
我想计算cumsum从每次运行信号开始的某个值,其中 signal == 1 . 示例数据: set.seed(123) df head(df,12) Date value sig
这个问题在这里已经有了答案: Cumsum with reset when 0 is encountered and by groups (2 个回答) Cumulative sum that res
dict={"asset":["S3","S2","E4","E1","A6","A8"], "Rank":[1,2,3,4,5,6],"number_of_attributes":[2,1,2,2,
这个问题在这里已经有了答案: Restart cumsum and get index if cumsum more than value (3 个答案) 关闭 2 年前。 我想在每次超过阈值 10
我想修改 cumsum 函数。我想将负值更改为 0。并且当有一个不同于 0 的新 D 值时,则使用 D-S。 下面的例子: TD % group_by(product) %>% mutate(res
是否可以在一列中迭代使用 cumsum() 并在另一列上以开始 - 停止为条件: 给定数据帧 df 和一列 X 其中值是递增的。 cumsum() 应在达到 10 或 10 的倍数时停止(例如 20、
带有数据框: df <- data.frame(id = rep(1:3, each = 5) , hour = rep(1:5, 3)
In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])
我目前正在尝试创建一个累积总和列,该列将根据 Game_ID 创建一个累积总和,但一次只计算与 Game_ID 相关的值。例如,玩家 A 在 Game_ID == 1 中拍摄 20 次,在 Game_
我正在尝试计算每组从最后一行到第一行的cumsum。 示例数据: t1 ts var val val2 1 a 0 2 2 a 0 2 3 a 0
我有一个矩阵,例如: A= [ 1 2 3 4 3 5 6 6 4 1 2 3 ] 我想以另一个矩阵(或数据框)的形式获取列的累积和。例如,这个矩阵会给出: B= [1 2 3 4
我是一名优秀的程序员,十分优秀!