作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
给定以下数据框df
:
df = pd.DataFrame({'A':['Tony', 'Mike', 'Jen', 'Anna'], 'B': ['no', 'yes', 'no', 'yes']})
A B
0 Tony no
1 Mike yes
2 Jen no
3 Anna yes
我想添加另一列,逐步计算具有 df['B']='yes'
的元素:
A B C
0 Tony no 0
1 Mike yes 1
2 Jen no 0
3 Anna yes 2
我该怎么做?
最佳答案
您可以使用 numpy.where
与 cumsum
bool 掩码:
m = df['B']=='yes'
df['C'] = np.where(m, m.cumsum(), 0)
另一种解决方案是通过过滤创建count
bool 掩码,然后通过reindex
添加0
值:
m = df['B']=='yes'
df['C'] = m[m].cumsum().reindex(df.index, fill_value=0)
print (df)
A B C
0 Tony no 0
1 Mike yes 1
2 Jen no 0
3 Anna yes 2
性能(实际数据应该不同,最好先检查一下):
np.random.seed(123)
N = 10000
L = ['yes','no']
df = pd.DataFrame({'B': np.random.choice(L, N)})
print (df)
In [150]: %%timeit
...: m = df['B']=='yes'
...: df['C'] = np.where(m, m.cumsum(), 0)
...:
1.57 ms ± 34.6 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
In [151]: %%timeit
...: m = df['B']=='yes'
...: df['C'] = m[m].cumsum().reindex(df.index, fill_value=0)
...:
2.53 ms ± 54.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
In [152]: %%timeit
...: df['C'] = df.groupby('B').cumcount() + 1
...: df['C'].where(df['B'] == 'yes', 0, inplace=True)
4.49 ms ± 27.6 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
关于python - Pandas:添加满足条件的元素的渐进计数列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51768947/
前几天我读到了一种特殊类型的回调,当你重复调用它时,它会随着你的进展而进行。就像第一次调用它时执行 A 并返回一样,然后在下次调用它时执行 B。最终它以某种方式发出信号,表明最终行动已经采取。 我不记
我正在使用 php Gmagick 修改图像。以下代码按预期工作,只是图像不是渐进的。为什么?根据GraphicsMagick docs它应该。作为引用,输入图像为 666 x 1000。 $
我希望能够使用 Flash 播放器传送音乐/mp3,但我想让 mp3 文件无法被嗅探......即你不能使用 safari、firebug 等。使用事件窗口找出 mp3 位置。我没有流媒体服务器。任何
我是一名优秀的程序员,十分优秀!