gpt4 book ai didi

python - 二进制 numpy 数组之间的快速汉明距离计算

转载 作者:太空狗 更新时间:2023-10-29 21:15:00 26 4
gpt4 key购买 nike

我有两个包含二进制值的相同长度的 numpy 数组

import numpy as np
a=np.array([1, 1, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 1, 1, 0])
b=np.array([1, 1, 1, 1, 0, 1, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1])

我想尽快计算出它们之间的汉明距离,因为我要进行数百万次这样的距离计算。

这是一个简单但缓慢的选项(取自维基百科):

%timeit sum(ch1 != ch2 for ch1, ch2 in zip(a, b))
10000 loops, best of 3: 79 us per loop

我想出了更快的选项,灵感来自这里关于堆栈溢出的一些答案。

%timeit np.sum(np.bitwise_xor(a,b))
100000 loops, best of 3: 6.94 us per loop

%timeit len(np.bitwise_xor(a,b).nonzero()[0])
100000 loops, best of 3: 2.43 us per loop

我想知道是否有更快的方法来计算这个,可能使用 cython?

最佳答案

有一个现成的 numpy 函数胜过 len((a != b).nonzero()[0]) ;)

np.count_nonzero(a!=b)

关于python - 二进制 numpy 数组之间的快速汉明距离计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32730202/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com