gpt4 book ai didi

python 在矢量化后打印生成器列表?

转载 作者:行者123 更新时间:2023-12-01 05:46:44 24 4
gpt4 key购买 nike

我对矢量化和生成器很陌生。到目前为止,我已经创建了以下函数:

import numpy as np

def ismember(a,b):
for i in a:
if len(np.where(b==i)[0]) == 0:
lv_var = 0
else:
lv_var = np.int(np.where(b==i)[0])
yield lv_var

vect = np.vectorize(ismember)

A = np.array(xrange(700000))
B = np.array(xrange(700000))

lv_result = vect(A,B)

当我尝试将 lv_result 转换为列表或循环生成的 numpy 数组时,我得到了生成器对象的列表。我需要以某种方式得到实际结果。如何打印该函数的实际结果?生成器上的 .next() 似乎无法完成这项工作。

有人可以告诉我我做错了什么或者我如何重新配置​​代码以实现最终目标?

------------------------------------------------------------ ----

好的,我现在了解了矢量化部分(感谢 Viet Nguyen 的示例)。
我还能够打印生成器对象结果。代码已被修改。请参阅下文。

对于生成器部分:

我想做的是模仿一个名为 ismember 的 MATLAB 函数(格式为:[Lia,Locb] = ismember(A,B)。我只是想获取 Locb 部分。

From Matlab: Locb, contain the lowest index in B for each value in A that is a member of B. The output array, Locb, contains 0 wherever A is not a member of B

主要问题之一是我需要能够尽可能高效地执行此操作。为了进行测试,我有两个 700k 元素的数组。创建一个生成器并检查生成器的值似乎并没有获得任何更好的性能。

为了打印生成器,我在下面创建了函数 f()。

import numpy as np

def ismember(a,b):
for i in a:
index = np.where(b==i)[0]
if len(index) == 0:
yield 0
else:
yield index


def f(A, gen_obj):
my_array = np.arange(len(A))
for i in my_array:
my_array[i] = gen_obj.next()
return my_array


A = np.arange(700000)
B = np.arange(700000)

gen_obj = ismember(A,B)

f(A, gen_obj)

print 'done'

注意:如果我们用较小的数组尝试上面的代码:可以说。

A = np.array([3,4,4,3,6])

B = np.array([2,5,2,6,3])

结果将是一个数组:[4 0 0 4 3]

就像 matlabs 函数一样:目标是为 A 中属于 B 的成员的每个值获取 B 中的最低索引。只要 A 不是 B 的成员,输出数组 Locb 就包含 0。

Numpy 的交集函数并不能帮助我实现目标。另外,返回数组的大小需要与数组 A 的大小保持相同。

到目前为止,这个过程需要很长时间(对于 700k 元素的数组)。不幸的是我还没有找到最好的解决方案。任何关于如何重新配置​​代码以实现最终目标并获得最佳性能的意见,我们将不胜感激。

<小时/>

优化问题已解决:

python-run-generator-using-multiple-cores-for-optimization

最佳答案

我相信您误解了 numpy.vectorize 函数的输入。 “向量化”函数基于每个元素对数组进行操作 ( see numpy.vectorize reference )。您的函数 ismember 似乎假定输入 ab 是数组。相反,将该函数视为与内置 map() 一起使用的函数。

> import numpy as np
> def mask(a, b):
> return 1 if a == b else 0
> a = np.array([1, 2, 3, 4])
> b = np.array([1, 3, 4, 5])
> maskv = np.vectorize(mask)
> maskv(a, b)
array([1, 0, 0, 0])

另外,如果我正确理解你的意图,NumPy 带有 intersection function .

关于python 在矢量化后打印生成器列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15858435/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com