gpt4 book ai didi

python - 使用 Python 中的其他值更新 numpy 数组中的值

转载 作者:行者123 更新时间:2023-12-04 01:23:55 26 4
gpt4 key购买 nike

给定以下数组:

a = np.array([[1,2,3],[4,5,6],[7,8,9]])

[[1 2 3]
[4 5 6]
[7 8 9]]

如何用其他值替换某些值?

bad_vals = [4, 2, 6]
update_vals = [11, 1, 8]

我目前使用:

for idx, v in enumerate(bad_vals):
a[a==v] = update_vals[idx]

给出:

[[ 1  1  3]
[11 5 8]
[ 7 8 9]]

但是对于需要替换的值很多的大数组,速度会比较慢。有什么好的选择吗?

输入数组可以更改为任何内容(list of list/tuples)如果这可能是访问某些快速黑魔法所必需的.

编辑:

根据@Divakar 和@charlysotelo 的出色回答,使用 benchit 包对我的真实用例日期进行了快速比较。我的输入数据数组的比率或多或少为 100:1 (rows:columns),其中替换值数组的长度为 3 x行大小。

函数:

# current approach
def enumerate_values(a, bad_vals, update_vals):
for idx, v in enumerate(bad_vals):
a[a==v] = update_vals[idx]
return a

# provided solution @Divakar
def map_values(a, bad_vals, update_vals):
N = max(a.max(), max(bad_vals))+1
mapar = np.empty(N, dtype=int)
mapar[a] = a
mapar[bad_vals] = update_vals
out = mapar[a]
return out

# provided solution @charlysotelo
def vectorize_values(a, bad_vals, update_vals):
bad_to_good_map = {}
for idx, bad_val in enumerate(bad_vals):
bad_to_good_map[bad_val] = update_vals[idx]
f = np.vectorize(lambda x: (bad_to_good_map[x] if x in bad_to_good_map else x))
a = f(a)

return a

# define benchit input functions
import benchit
funcs = [enumerate_values, map_values, vectorize_values]

# define benchit input variables to bench against
in_ = {
n: (
np.random.randint(0,n*10,(n,int(n * 0.01))), # array
np.random.choice(n*10, n*3,replace=False), # bad_vals
np.random.choice(n*10, n*3) # update_vals
)
for n in [300, 1000, 3000, 10000, 30000]
}

# do the bench
# btw: timing of bad approaches (my own function here) take time
t = benchit.timings(funcs, in_, multivar=True, input_name='Len')
t.plot(logx=True, grid=False)

timings benchit

最佳答案

这是一种基于正数的暗示映射数组方法的方法-

def map_values(a, bad_vals, update_vals):
N = max(a.max(), max(bad_vals))+1
mapar = np.empty(N, dtype=int)
mapar[a] = a
mapar[bad_vals] = update_vals
out = mapar[a]
return out

sample 运行-

In [94]: a
Out[94]:
array([[1, 2, 1],
[4, 5, 6],
[7, 1, 1]])

In [95]: bad_vals
Out[95]: [4, 2, 6]

In [96]: update_vals
Out[96]: [11, 1, 8]

In [97]: map_values(a, bad_vals, update_vals)
Out[97]:
array([[ 1, 1, 1],
[11, 5, 8],
[ 7, 1, 1]])

基准测试

# Original soln
def replacevals(a, bad_vals, update_vals):
out = a.copy()
for idx, v in enumerate(bad_vals):
out[out==v] = update_vals[idx]
return out

给定的样本具有 nxn 的二维输入,其中 n 个样本将被替换。让我们设置具有相同结构的输入数据集。

使用 benchit包(几个基准测试工具打包在一起;免责声明:我是它的作者)来基准测试建议的解决方案。

import benchit
funcs = [replacevals, map_values]
in_ = {n:(np.random.randint(0,n*10,(n,n)),np.random.choice(n*10,n,replace=False),np.random.choice(n*10,n)) for n in [3,10,100,1000,2000]}
t = benchit.timings(funcs, in_, multivar=True, input_name='Len')
t.plot(logx=True, save='timings.png')

剧情:

enter image description here

关于python - 使用 Python 中的其他值更新 numpy 数组中的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62183295/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com