gpt4 book ai didi

python - 用索引从数组中填充 1D numpy 数组

转载 作者:太空宇宙 更新时间:2023-11-03 13:32:23 26 4
gpt4 key购买 nike

背景

我有一个用零初始化的一维 NumPy 数组。

import numpy as np
section = np.zeros(1000)

然后我有一个 Pandas DataFrame,其中有两列索引:

d= {'start': {0: 7200, 1: 7500, 2: 7560, 3: 8100, 4: 11400},
'end': {0: 10800, 1: 8100, 2: 8100, 3: 8150, 4: 12000}}

df = pd.DataFrame(data=d, columns=['start', 'end'])

对于每一对索引,我想将 numpy 数组中相应索引的值设置为 True。

我目前的解决方案

我可以通过对 DataFrame 应用一个函数来做到这一点:

def fill_array(row):
section[row.start:row.end] = True

df.apply(fill_array, axis=1)

我想向量化这个操作

这如我所料,但为了好玩,我想对操作进行向量化。我对此不是很精通,我的在线搜索也没有让我走上正轨。

如果可能的话,我将非常感谢任何关于如何将其变成向量操作的建议。

最佳答案

实现要遵循的技巧是,我们将 1s 放在每个开始点,-1s 放在零初始化的 int 数组的每个结束点。接下来是真正的技巧,因为我们会对其进行累加求和,从而为 bin(开始 - 停止对)边界所覆盖的位置提供非零数字。因此,最后一步是为最终输出寻找非零值作为 bool 数组。因此,我们将有两个矢量化解决方案,其实现如下所示 -

def filled_array(start, end, length):
out = np.zeros((length), dtype=int)
np.add.at(out,start,1)
np.add.at(out,end,-1)
return out.cumsum()>0

def filled_array_v2(start, end, length): #Using @Daniel's suggestion
out =np.bincount(start, minlength=length) - np.bincount(end, minlength=length)
return out.cumsum().astype(bool)

sample 运行-

In [2]: start
Out[2]: array([ 4, 7, 5, 15])

In [3]: end
Out[3]: array([12, 12, 7, 17])

In [4]: out = filled_array(start, end, length=20)

In [7]: pd.DataFrame(out) # print as dataframe for easy verification
Out[7]:
0
0 False
1 False
2 False
3 False
4 True
5 True
6 True
7 True
8 True
9 True
10 True
11 True
12 False
13 False
14 False
15 True
16 True
17 False
18 False
19 False

关于python - 用索引从数组中填充 1D numpy 数组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45057110/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com