gpt4 book ai didi

python - 从 2 个 1D 数组生成 2D 数组的矢量化方法

转载 作者:太空宇宙 更新时间:2023-11-04 01:46:15 26 4
gpt4 key购买 nike

我有一对等长的 numpy 数组。 dwells 包含表示停留时间的 float ,ids 表示状态。在我的示例中,只有 3 个标记为 012 的唯一状态。

dwells = np.array([4.3,0.2,3,1.5])
ids = np.array([2, 0, 1, 2])

前 2 个数组模拟一个系统,该系统从状态 2 开始,停留 4.3 秒,跳转到状态 0,停留 code>0.2 秒等。我想生成另一个 numpy 数组。它需要与 dwells.sum() 一样多的列,每列代表一个整数 0,1,2,3... 表示时间。每行匹配一个唯一状态(在本例中为 3)。该数组的每个元素代表该时间段内每个州的相对贡献。例如,在前 4 个时间点,只有状态 2 有贡献,因此第 2 行的前 4 个元素等于 1。第五列包含所有 3 个州的贡献,但 sum 等于 1

[[0, 0, 0, 0, 0.2, 0, 0,  0,  0]
[0, 0, 0, 0, 0.5, 1, 1, 0.5, 0]
[1, 1, 1, 1, 0.3, 0, 0, 0.5, 1]]

我可以用 for 循环来做到这一点,但我想知道是否有更有效的向量化方法。

最佳答案

假设我们有一个最小的 delta 时间步长:

import numpy as np

dwells = np.array([4.3,0.2,3,1.5])
ids = np.array([2, 0, 1, 2])

def dwell_map(dwells, ids, delta=0.1):
import numpy as np
import sys

idelta = 1 / delta

# ensure that idelta is an integer number
if not idelta.is_integer():
raise ValueError("1/delta is not integer")

idelta = int(idelta)

# create new longer dwells array
dwells_l = (dwells*idelta).astype(int)

# create target array
a = np.zeros((ids.max()+1, dwells_l.sum().astype(int)), dtype=int)

# create repeats of the ids according to the dwell time
ind = np.repeat(ids, dwells_l)

# put ones at the position where we have the indices
a[ind, np.arange(ind.size)] = 1

# reduce back to the original time resolution
a = a.reshape(ids.max()+1, -1, idelta).sum(axis=2)/idelta

return a

res = dwell_map(dwells, ids, 0.1)

只有当 delta 足够大且总持续时间足够小时,这才会很好地工作,这样中间数组就不会“无限”地增长。

根据您的示例数组的 iPython %timeit 魔术的性能,将其与您的 for 循环解决方案进行比较:

10000 loops, best of 5: 58.5 µs per loop

关于python - 从 2 个 1D 数组生成 2D 数组的矢量化方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59037789/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com