python - Numpy:当某些向量元素等于零时，矩阵向量乘法不会跳过计算吗？-6ren

python - Numpy:当某些向量元素等于零时，矩阵向量乘法不会跳过计算吗？

转载作者：太空宇宙更新时间：2023-11-03 11:47:44

26

4

我最近一直在做一个项目，我的大部分时间都花在乘以密集矩阵 A 和稀疏向量 v(参见 here) .在尝试减少计算时，我注意到 A.dot(v) 的运行时间不受 v 的零条目数的影响。

为了解释为什么我希望运行时间在这种情况下有所改善，让 result = A.dot.v 以便 result[j] = sum_i(A[i,j] *v[j]) 对于 j = 1...v.shape[0]。如果 v[j] = 0 那么显然 result[j] = 0 无论值 A[::,j]。在这种情况下，我因此希望 numpy 只设置 result[j] = 0 但它似乎继续计算 sum_i(A[i,j]*v[j ]) 无论如何。

我继续写了一个简短的示例脚本来确认下面的这种行为。

import time
import numpy as np

np.__config__.show() #make sure BLAS/LAPACK is being used
np.random.seed(seed = 0)
n_rows, n_cols = 1e5, 1e3

#initialize matrix and vector
A = np.random.rand(n_rows, n_cols)
u = np.random.rand(n_cols)
u = np.require(u, dtype=A.dtype, requirements = ['C'])

#time
start_time = time.time()
A.dot(u)
print "time with %d non-zero entries: %1.5f seconds" % (sum(u==0.0), (time.time() - start_time))

#set all but one entry of u to zero
v = u
set_to_zero = np.random.choice(np.array(range(0, u.shape[0])), size = (u.shape[0]-2), replace=False)
v[set_to_zero] = 0.0

start_time = time.time()
A.dot(v)
print "time with %d non-zero entries: %1.5f seconds" % (sum(v==0.0), (time.time() - start_time))


#what I would really expect it to take
non_zero_index = np.squeeze(v != 0.0)
A_effective = A[::,non_zero_index]
v_effective = v[non_zero_index]


start_time = time.time()
A_effective.dot(v_effective)
print "expected time with %d non-zero entries: %1.5f seconds" % (sum(v==0.0), (time.time() - start_time))

运行它，我发现无论我使用密集矩阵 u 还是稀疏矩阵 v，矩阵向量乘法的运行时间都是相同的:

time with 0 non-zero entries: 0.04279 seconds
time with 999 non-zero entries: 0.04050 seconds
expected time with 999 non-zero entries: 0.00466 seconds

我想知道这是否是设计使然？还是我在运行矩阵向量乘法的过程中遗漏了一些东西。 就像健全性检查一样:我确保 numpy 链接到我机器上的 BLAS 库并且两个数组都是 C_CONTIGUOUS(因为这显然是 numpy 调用 BLAS 所必需的)。

最佳答案

试试像这样的简单函数怎么样？

def dot2(A,v):
    ind = np.where(v)[0]
    return np.dot(A[:,ind],v[ind])

In [352]: A=np.ones((100,100))

In [360]: timeit v=np.zeros((100,));v[::60]=1;dot2(A,v)
10000 loops, best of 3: 35.4 us per loop

In [362]: timeit v=np.zeros((100,));v[::40]=1;dot2(A,v)
10000 loops, best of 3: 40.1 us per loop

In [364]: timeit v=np.zeros((100,));v[::20]=1;dot2(A,v)
10000 loops, best of 3: 46.5 us per loop

In [365]: timeit v=np.zeros((100,));v[::60]=1;np.dot(A,v)
10000 loops, best of 3: 29.2 us per loop

In [366]: timeit v=np.zeros((100,));v[::20]=1;np.dot(A,v)
10000 loops, best of 3: 28.7 us per loop

一个完全迭代的 Python 实现是:

def dotit(A,v, test=False):
    n,m = A.shape  
    res = np.zeros(n)
    if test:
        for i in range(n):
            for j in range(m):
                if v[j]:
                    res[i] += A[i,j]*v[j]
    else:
        for i in range(n):
            for j in range(m):
                res[i] += A[i,j]*v[j]
    return res

显然这不会像编译的dot 那样快，但我希望测试的相对优势仍然适用。为了进一步测试，您可以在 cython 中实现它。

请注意 v[j] 测试发生在迭代的深处。

对于稀疏 v(100 个元素中的 3 个)测试可以节省时间:

In [374]: timeit dotit(A,v,True)
100 loops, best of 3: 3.81 ms per loop

In [375]: timeit dotit(A,v,False)
10 loops, best of 3: 21.1 ms per loop

但是如果 v 是密集的，它会花费时间:

In [376]: timeit dotit(A,np.arange(100),False)
10 loops, best of 3: 22.7 ms per loop

In [377]: timeit dotit(A,np.arange(100),True)
10 loops, best of 3: 25.6 ms per loop

关于python - Numpy:当某些向量元素等于零时，矩阵向量乘法不会跳过计算吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35282214/

26

4

0

文章推荐： php - 此查询的输出值/类型是什么？

文章推荐： c# 如何让 keydown 和 button click 做同样的事情？

文章推荐： android - 名称为 [DEFAULT] 的 FirebaseApp 不存在并出现错误

文章推荐： c# - 下拉列表自定义数据绑定(bind)

java - 跳过 M 个元素并从 LinkedList 中删除 N 个元素，跳过 0 引发问题
我的算法- private static MyList skip$DeleteItem(MyList L , int M , int N){ MyList curr = L; MyLi
prolog - 跳过/通过非标准序言代码
我正在 SWI-Prolog 下开发，但我的目标是 Erlog (https://github.com/rvirding/erlog)。我需要一种使用非标准 Prolog 语法的方法。有没有办法
loops - 如何批量创建循环/跳过
我正在尝试从应用程序下载一大堆文件。它的shell命令是“下载文件名”。我有一个文本文件，其中包含必须下载的所有文件名。我要做的就是运行一个脚本/命令，以便在执行上述命令时 1.从文本文件中提取文件
javascript - 跳过 if 语句和循环中未定义的值
我试图循环遍历所有用户的评论，但使用 if 语句查找特定值。问题是我的应用程序崩溃了，因为一些用户没有发表评论，因此我得到“无法读取‘收集’未定义的属性”。如何跳过 if 语句的未定义值？代码如下:
跳过 Elasticsearch 分区索引与匹配无文档查询
我们有按年份分区的索引，例如: items-2019 items-2020 考虑以下数据: POST items-2019/_doc { "@timestamp": "2019-01-01" }
javascript - 跳过 For 循环中的某些数字
我只是编写一个页面来按实体编号查看每个 ASCII 条目，我想知道是否有一种更简单/更干净的方法来跳过不需要的数字。 var x = new Ar
组织模式重复 TODO 跳过
我希望能够普遍使用重复条目，但也能够跳过特定日期。例子: ** TODO swim practice SCHEDULED 但是，我提前知道 2013-12-25 不会有练习。但是，当我将项目标
java - 跳过 for 循环中的一次迭代
如何跳过像这样的 for 循环的一次迭代: for (int i = 65; i <= 90; i++) { if (!(i == 73)) { uniq.add((char) i);
java - 跳过 while 循环的第一行
这个问题已经存在: Scanner issue when using nextLine after nextXXX [duplicate] 已关闭 9 年前。 ask=1; while(ask==1)
java - 跳过 while 语句
我在使用一个程序时遇到了一些麻烦，我应该允许用户在程序中输入任意数量的数字，直到他们不再想要为止。然后程序应该计算输入数字的平均值和最大值。我哪里做错了？ import java.util.Scann
arrays - 跳过 “for each”循环中的第一个元素？
我有一个名为segments的 Sprite 数组，我想在每个循环中跳过segments的第一个元素。我目前正在这样做: var first = true; for each (var segment
java - 跳过 for 循环的某些迭代
我目前正在编写一个 for 循环来遍历包含 38 个元素的 2D。然而，其中一些元素为空，我希望 for 循环简单地跳过它们(因为在我正在解决的难题中，它们没有与它们相关的移动)。快速搜索表明，我可以
跳过 Python 预提交单元测试
我想使用pre-commit处理我的 git 项目的 git hooks。但是，当我使用它时，git commit 命令不断跳过 unittest 执行: (smartexchange) trnboo
c - fgets() 跳过
这个问题在这里已经有了答案: Does scanf() take '\n' as input leftover from previous scanf()? (1 个回答) 关闭 9 年前。我正在
python - 跳过 for 循环中的错误行
我正在迭代 csv 文件中的每一行，并仅选择/计算满足条件的行。但是，当连续出现错误时，它会停止循环。有没有办法告诉 python 跳过错误并移动到下一行？我使用了 try 函数但没有工作。我的代码是
跳过 Scala 模式匹配案例
感谢您提供的优秀示例，我试过了，它按我的预期工作。很高兴看到有人了解问题的本质。但是，我认为我应该用 Lift 标记问题，因为我正在使用 Lift 框架，这就是(仍然)发生这个问题的地方(尽管我仍然认
javascript - 跳过 do/while 循环
大家好，我正在编写一个算法来从 NodeTree 中删除具体分支(例如 DSF)。如果您选择 Node 的名称，算法将检查该 Node 是否是其他 Node 的父 Node ；如果是，它会获取该 No
c - 跳过 for 循环的一次迭代
附有代码和输出。基本上它是第二次跳过我的输入。就像我启动代码一样，它让我输入一个选项，然后第二次跳过输入，直接转到开关的默认情况。然后第三次它就会允许我输入。不明白为什么。任何帮助将不胜感激。
Javascript 跳过 For 循环中的间隔
我在 JavaScript 中有一个 for 循环，它会定期跳过间隔，但我无法确定原因。 console.log(parseInt($('input.num-to-add').val())); num
java - 跳过 for 循环中的元素并重新分配它
我正在 JasperSoft 中填写参数。在我的报告中我有参数:参数_1、参数_2、参数_3 int a; for (a = 0; a < headers.length; a++) {

首页

博学

6Ren·AI

商城

python - Numpy:当某些向量元素等于零时，矩阵向量乘法不会跳过计算吗？