- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
几年前,有人posted在 Active State Recipes 上用于比较目的,三个 python/NumPy 函数;其中每一个都接受相同的参数并返回相同的结果,一个距离矩阵。
其中两个来自已发布的资源;它们都是——或者在我看来它们是——惯用的 numpy 代码。创建距离矩阵所需的重复计算由 numpy 优雅的索引语法驱动。这是其中之一:
from numpy.matlib import repmat, repeat
def calcDistanceMatrixFastEuclidean(points):
numPoints = len(points)
distMat = sqrt(sum((repmat(points, numPoints, 1) -
repeat(points, numPoints, axis=0))**2, axis=1))
return distMat.reshape((numPoints,numPoints))
第三个使用单个循环创建距离矩阵(考虑到只有 1,000 个二维点的距离矩阵有 100 万个条目,这显然是很多循环)。乍一看,这个函数就像我在学习 NumPy 时编写的代码,我会先编写 Python 代码,然后逐行翻译它来编写 NumPy 代码。
在 Active State 发布几个月后,在 thread 中发布并讨论了比较这三者的性能测试结果。在 NumPy 邮件列表上。
带有循环的函数实际上显着优于另外两个:
from numpy import mat, zeros, newaxis
def calcDistanceMatrixFastEuclidean2(nDimPoints):
nDimPoints = array(nDimPoints)
n,m = nDimPoints.shape
delta = zeros((n,n),'d')
for d in xrange(m):
data = nDimPoints[:,d]
delta += (data - data[:,newaxis])**2
return sqrt(delta)
线程中的一位参与者 (Keir Mierle) 提供了这可能是真的原因:
The reason that I suspect this will be faster is that it has better locality, completely finishing a computation on a relatively small working set before moving onto the next one. The one liners have to pull the potentially large MxN array into the processor repeatedly.
根据这位发帖人自己的说法,他的言论只是一种怀疑,似乎没有进一步讨论过。
关于如何解释这些结果还有其他想法吗?
特别是,是否有一个有用的规则——关于何时循环和何时索引——可以从这个例子中提取出来作为编写 numpy 代码的指导?
对于那些不熟悉 NumPy 或没有看过代码的人来说,这种比较不是基于边缘情况——如果是的话,我肯定不会那么感兴趣。相反,这种比较涉及一个函数,该函数执行矩阵计算中的常见任务(即,在给定两个前提条件的情况下创建结果数组);此外,每个函数又由最常见的 numpy 内置函数组成。
最佳答案
TL; DR 上面的第二个代码只是在点的维数上循环(3D 点通过 for 循环 3 次)所以循环并不多。上面第二个代码真正的加速是它更好地利用 Numpy 的强大功能来避免在查找点之间的差异时创建一些额外的矩阵。这减少了内存使用和计算工作量。
更长的解释我认为 calcDistanceMatrixFastEuclidean2
函数可能用它的循环来欺骗您。它只是循环遍历点的维数。对于 1D 点,循环仅执行一次,对于 2D,两次,对于 3D,三次。这实际上根本没有太多循环。
让我们稍微分析一下代码,看看为什么一个比另一个快。 calcDistanceMatrixFastEuclidean
我将调用 fast1
并且 calcDistanceMatrixFastEuclidean2
将是 fast2
。
fast1
基于 Matlab 的处理方式,repmap
函数证明了这一点。 repmap
函数在这种情况下创建一个数组,它只是一遍又一遍重复的原始数据。但是,如果您查看该函数的代码,它的效率非常低。它使用许多 Numpy 函数(3 个 reshape
和 2 个 repeat
)来执行此操作。 repeat
函数还用于创建一个数组,其中包含每个数据项重复多次的原始数据。如果我们的输入数据是 [1,2,3]
那么我们从中减去 [1,2,3,1,2,3,1,2,3]
[1,1,1,2,2,2,3,3,3]
。 Numpy 不得不在运行 Numpy 的 C 代码之间创建很多额外的矩阵,这本可以避免。
fast2
使用 Numpy 的更多繁重工作,而无需在 Numpy 调用之间创建尽可能多的矩阵。 fast2
遍历点的每个维度,进行减法运算并保留每个维度之间平方差的总和。只有在最后才完成平方根。到目前为止,这听起来可能不如 fast1
高效,但是 fast2
通过使用 Numpy 的索引避免了执行 repmat
操作。为了简单起见,让我们看一下一维情况。 fast2
创建一维数据数组,然后从二维 (N x 1) 数据数组中减去它。这会在每个点和所有其他点之间创建差异矩阵,而无需使用 repmat
和 repeat
,从而绕过创建大量额外数组。在我看来,这就是真正的速度差异所在。 fast1
在矩阵之间创建了很多额外的东西(并且它们的计算成本很高)以找到点之间的差异,而 fast2
更好地利用 Numpy 的强大功能来避免这些差异。
顺便说一句,这里是 fast2
的一个稍微快一点的版本:
def calcDistanceMatrixFastEuclidean3(nDimPoints):
nDimPoints = array(nDimPoints)
n,m = nDimPoints.shape
data = nDimPoints[:,0]
delta = (data - data[:,newaxis])**2
for d in xrange(1,m):
data = nDimPoints[:,d]
delta += (data - data[:,newaxis])**2
return sqrt(delta)
区别在于我们不再将 delta 创建为零矩阵。
关于python - 为什么循环在这里胜过索引?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3518574/
我是 PHP 新手。我一直在脚本中使用 for 循环、while 循环、foreach 循环。我想知道 哪个性能更好? 选择循环的标准是什么? 当我们在另一个循环中循环时应该使用哪个? 我一直想知道要
我在高中的编程课上,我的作业是制作一个基本的小计和顶级计算器,但我在一家餐馆工作,所以制作一个只能让你在一种食物中读到。因此,我尝试让它能够接收多种食品并将它们添加到一个价格变量中。抱歉,如果某些代码
这是我正在学习的一本教科书。 var ingredients = ["eggs", "milk", "flour", "sugar", "baking soda", "baking powder",
我正在从字符串中提取数字并将其传递给函数。我想给它加 1,然后返回字符串,同时保留前导零。我可以使用 while 循环来完成此操作,但不能使用 for 循环。 for 循环只是跳过零。 var add
编辑:我已经在程序的输出中进行了编辑。 该程序要求估计给定值 mu。用户给出一个值 mu,同时还提供了四个不等于 1 的不同数字(称为 w、x、y、z)。然后,程序尝试使用 de Jaeger 公式找
我正在编写一个算法,该算法对一个整数数组从末尾到开头执行一个大循环,其中包含一个 if 条件。第一次条件为假时,循环可以终止。 因此,对于 for 循环,如果条件为假,它会继续迭代并进行简单的变量更改
现在我已经习惯了在内存非常有限的情况下进行编程,但我没有答案的一个问题是:哪个内存效率更高;- for(;;) 或 while() ?还是它们可以平等互换?如果有的话,还要对效率问题发表评论! 最佳答
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 8 年前。 我正在尝试创建一个小程序,我可以在其中读取该程序的单词。如果单词有 6
这个问题在这里已经有了答案: python : list index out of range error while iteratively popping elements (12 个答案) 关
我正在尝试向用户请求 4 到 10 之间的整数。如果他们回答超出该范围,它将进入循环。当用户第一次正确输入数字时,它不会中断并继续执行 else 语句。如果用户在 else 语句中正确输入数字,它将正
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我想要做的事情是使用循环创建一个数组,然后在另一个类中调用该数组,这不会做,也可能永远不会做。解决这个问题最好的方法是什么?我已经寻找了所有解决方案,但它们无法编译。感谢您的帮助。 import ja
我尝试创建一个带有嵌套 foreach 循环的列表。第一个循环是循环一些数字,第二个循环是循环日期。我想给一个日期写一个数字。所以还有另一个功能来检查它。但结果是数字多次写入日期。 Out 是这样的:
我正在模拟一家快餐店三个多小时。这三个小时分为 18 个间隔,每个间隔 600 秒。每个间隔都会输出有关这 600 秒内发生的情况的统计信息。 我原来的结构是这样的: int i; for (i=0;
这个问题已经有答案了: IE8 for...in enumerator (3 个回答) How do I check if an object has a specific property in J
哪个对性能更好?这可能与其他编程语言不一致,所以如果它们不同,或者如果你能用你对特定语言的知识回答我的问题,请解释。 我将使用 c++ 作为示例,但我想知道它在 java、c 或任何其他主流语言中的工
这个问题不太可能帮助任何 future 的访问者;它只与一个小的地理区域、一个特定的时间点或一个非常狭窄的情况有关,这些情况并不普遍适用于互联网的全局受众。为了帮助使这个问题更广泛地适用,visit
我是 C 编程和编写代码的新手,以确定 M 测试用例的质因数分解。如果我一次只扫描一次,该功能本身就可以工作,但是当我尝试执行 M 次时却惨遭失败。 我不知道为什么 scanf() 循环有问题。 in
这个问题已经有答案了: JavaScript by reference vs. by value [duplicate] (4 个回答) 已关闭 3 年前。 我在使用 TSlint 时遇到问题,并且理
我尝试在下面的代码中添加 foreach 或 for 循环,以便为 Charts.js 创建多个数据集。这将允许我在此折线图上创建多条线。 我有一个 PHP 对象,我可以对其进行编码以稍后填充变量,但
我是一名优秀的程序员,十分优秀!