matlab/octave - 广义矩阵乘法-6ren

matlab/octave - 广义矩阵乘法

转载作者：太空宇宙更新时间：2023-11-03 19:17:01

25

4

我想做一个函数来概括矩阵乘法。基本上，它应该能够执行标准矩阵乘法，但它应该允许通过任何其他函数更改两个二元运算符的积/和。

目标是尽可能提高 CPU 和内存的效率。当然，它总是比 A*B 效率低，但运算符(operator)的灵 active 是这里的重点。

以下是我在阅读 various 后可能想到的一些命令interesting threads :

A = randi(10, 2, 3);
B = randi(10, 3, 4);

% 1st method
C = sum(bsxfun(@mtimes, permute(A,[1 3 2]),permute(B,[3 2 1])), 3)
% Alternative: C = bsxfun(@(a,b) mtimes(a',b), A', permute(B, [1 3 2]))

% 2nd method
C = sum(bsxfun(@(a,b) a*b, permute(A,[1 3 2]),permute(B,[3 2 1])), 3)

% 3rd method (Octave-only)
C = sum(permute(A, [1 3 2]) .* permute(B, [3 2 1]), 3)

% 4th method (Octave-only): multiply nxm A with nx1xd B to create a nxmxd array
C = bsxfun(@(a, b) sum(times(a,b)), A', permute(B, [1 3 2]));
C = C2 = squeeze(C(1,:,:)); % sum and turn into mxd

方法 1-3 的问题在于它们会在使用 sum() 折叠它们之前生成 n 个矩阵。 4 更好，因为它在 bsxfun 内部执行了 sum()，但是 bsxfun 仍然生成 n 个矩阵(除了它们大部分是空的，只包含一个非零值向量作为和，其余填充 0 以匹配尺寸要求)。

我想要的是类似于第 4 种方法但没有无用的 0 来节省内存。

有什么想法吗？

最佳答案

这是您发布的解决方案的稍微完善的版本，有一些小的改进。

我们检查我们的行数是否多于列数，或者相反，然后通过选择将行与矩阵相乘或矩阵与列相乘来相应地进行乘法运算(从而使循环迭代次数最少)。

A*B

注意:这可能并不总是最好的策略(按行而不是按列)，即使行数少于列数；事实上，MATLAB 数组存储在 column-major order 中在内存中使得按列切片更有效，因为元素是连续存储的。而访问行涉及通过 strides 遍历元素(缓存不友好——想一想 spatial locality)。

除此之外，代码应该处理双/单、实数/复数、全数/稀疏(以及不可能组合的错误)。它还尊重空矩阵和零维。

function C = my_mtimes(A, B, outFcn, inFcn)
    % default arguments
    if nargin < 4, inFcn = @times; end
    if nargin < 3, outFcn = @sum; end

    % check valid input
    assert(ismatrix(A) && ismatrix(B), 'Inputs must be 2D matrices.');
    assert(isequal(size(A,2),size(B,1)),'Inner matrix dimensions must agree.');
    assert(isa(inFcn,'function_handle') && isa(outFcn,'function_handle'), ...
        'Expecting function handles.')

    % preallocate output matrix
    M = size(A,1);
    N = size(B,2);
    if issparse(A)
        args = {'like',A};
    elseif issparse(B)
        args = {'like',B};
    else
        args = {superiorfloat(A,B)};
    end
    C = zeros(M,N, args{:});

    % compute matrix multiplication
    % http://en.wikipedia.org/wiki/Matrix_multiplication#Inner_product
    if M < N
        % concatenation of products of row vectors with matrices
        % A*B = [a_1*B ; a_2*B ; ... ; a_m*B]
        for m=1:M
            %C(m,:) = A(m,:) * B;
            %C(m,:) = sum(bsxfun(@times, A(m,:)', B), 1);
            C(m,:) = outFcn(bsxfun(inFcn, A(m,:)', B), 1);
        end
    else
        % concatenation of products of matrices with column vectors
        % A*B = [A*b_1 , A*b_2 , ... , A*b_n]
        for n=1:N
            %C(:,n) = A * B(:,n);
            %C(:,n) = sum(bsxfun(@times, A, B(:,n)'), 2);
            C(:,n) = outFcn(bsxfun(inFcn, A, B(:,n)'), 2);
        end
    end
end

比较

毫无疑问，该函数自始至终都比较慢，但对于较大的尺寸，它比内置矩阵乘法差几个数量级:

        (tic/toc times in seconds)
      (tested in R2014a on Windows 8)

    size      mtimes       my_mtimes 
    ____    __________     _________
     400     0.0026398       0.20282
     600      0.012039       0.68471
     800      0.014571        1.6922
    1000      0.026645        3.5107
    2000       0.20204         28.76
    4000        1.5578        221.51

mtimes_vs_mymtimes

测试代码如下:

sz = [10:10:100 200:200:1000 2000 4000];
t = zeros(numel(sz),2);
for i=1:numel(sz)
    n = sz(i); disp(n)
    A = rand(n,n);
    B = rand(n,n);

    tic
    C = A*B;
    t(i,1) = toc;
    tic
    D = my_mtimes(A,B);
    t(i,2) = toc;

    assert(norm(C-D) < 1e-6)
    clear A B C D
end

semilogy(sz, t*1000, '.-')
legend({'mtimes','my_mtimes'}, 'Interpreter','none', 'Location','NorthWest')
xlabel('Size N'), ylabel('Time [msec]'), title('Matrix Multiplication')
axis tight

额外

为了完整起见，下面是实现广义矩阵乘法的两种更简单的方法(如果您想比较性能，请将 my_mtimes 函数的最后一部分替换为其中任何一种)。我什至懒得张贴他们耗时:)

C = zeros(M,N, args{:});
for m=1:M
    for n=1:N
        %C(m,n) = A(m,:) * B(:,n);
        %C(m,n) = sum(bsxfun(@times, A(m,:)', B(:,n)));
        C(m,n) = outFcn(bsxfun(inFcn, A(m,:)', B(:,n)));
    end
end

另一种方式(使用三重循环):

C = zeros(M,N, args{:});
P = size(A,2); % = size(B,1);
for m=1:M
    for n=1:N
        for p=1:P
            %C(m,n) = C(m,n) + A(m,p)*B(p,n);
            %C(m,n) = plus(C(m,n), times(A(m,p),B(p,n)));
            C(m,n) = outFcn([C(m,n) inFcn(A(m,p),B(p,n))]);
        end
    end
end

接下来要尝试什么？

如果您想获得更多性能，您将不得不转向 C/C++ MEX 文件以减少解释 MATLAB 代码的开销。您仍然可以通过从 MEX 文件调用优化的 BLAS/LAPACK 例程来利用它们(有关示例，请参见 the second part of this post)。 MATLAB 附带 Intel MKL坦率地说，在英特尔处理器上进行线性代数计算时，您无法击败它。

其他人已经在 File Exchange 上提到了一些将通用矩阵例程实现为 MEX 文件的提交(参见 @natan 的回答)。如果您将它们链接到优化的 BLAS 库，它们会特别有效。

关于matlab/octave - 广义矩阵乘法，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/24245225/

25

4

0

文章推荐： c# - 为什么我的数据表没有任何结果进来？

文章推荐： python - 如何判断句子中两个对象之间是否存在比较？

文章推荐： c# - 同时为 2 个框架构建 Visual Studio 项目

octave - Octave 中符号表达式的求值
假设我们在 Octave 中运行以下命令集: pkg load symbolic %loads the symbolic math package syms x y %declare x and y
octave - Octave 音阶中的向量到矩阵
Octave中vec的逆运算是什么？例如。如果我需要将12x1向量转换成3x4矩阵，该怎么办？最佳答案我不知道Octave，但我认为您正在寻找 reshape 。 — Built-in Func
octave - 在向量中搜索特定字符串( Octave )
我试图在向量中找到一个字符串。例如:query = "ab"in vector = ["ab", "cd", "abc", "cab"] 问题是:当我使用函数 strfind(vector,quer
octave - 变量作为字符串中的指数( Octave )
对于练习，我必须以 Octave 为单位创建函数 x^i 从 i=1 到 i=10 的动画图。绘图必须有一个动态的标题，曲线的颜色必须改变。目前我的代码如下: function exercicequa
octave - Octave 矩阵可以将字符串和数字放在一起吗？
有没有一种方法可以让 Octave 矩阵将字符串和数字放在一起？我想要一个休闲类型的矩阵: A=["A","B","C","D";1,2,3,4;2,3,4,5;3,4,5,6;4,5,6,7];
octave - Octave 梯度下降实现
事实上，我已经为此奋斗了大约两个月。是什么让这些有所不同？ hypotheses= X * theta temp=(hypotheses-y)' temp=X(:,1) * temp temp=tem
octave - Octave 图中的附加图例或文本框窗口
我想在我的绘图中添加带有注释的文本或图例框。目前我的图例绘制在东北外，我想将新的图例(或文本框)添加到东南外的位置。谢谢! 最佳答案缺乏有关您的案例的更多信息: 据我所知，一个坐标区对象只能有一
octave - Octave 图中的附加图例或文本框窗口
我想在我的绘图中添加带有注释的文本或图例框。目前我的图例绘制在东北外，我想将新的图例(或文本框)添加到东南外的位置。谢谢! 最佳答案缺乏有关您的案例的更多信息: 据我所知，一个坐标区对象只能有一
octave - Octave 整数除法
我想在 Octave 中执行整数除法(我使用的是最新版本 5.1.0)。我厌倦了 idivide(5, 2, "round") 应该产生 3。 Documentation表示将 idivide 与 r
octave - Octave 中有占位符变量吗？
我正在尝试从矩阵中按行获取最大索引。为此，我正在做: [throwaway, indexes] = max(blah, [], 2); 变量“throwaway”会存储我不再需要且永远不会使用的值，我
octave - Octave 安装后的警告
我在启动 Octave 后收到以下警告。我使用了来自 here 的安装说明. 可能是什么问题？这些是主要警告吗？我正在使用 Windows。 warning: gmsh does not seem t
octave - 在 Octave 中绘制决策边界线
我一直在学习机器学习类(class)，目前学习分类。我实现了分类算法并获得了参数和成本。该作业已经具有绘制决策边界的功能并且可以正常工作，但我试图阅读他们的代码但无法理解这些行。 plot_x = [
octave - 如何使用 Octave 更改极坐标图中的标记样式？
我正在尝试更改 octave 中的polar 图中标记的外观。 r = rand(1,10); % the radius t = 30*rand(1,10); % the angles polar(t
octave - 如何从 Octave 音阶的文件中读取矩阵？
我正在尝试从 Octave 中的文件读取矩阵，但我找不到解决方案。输入文件是: 4 1 4 2 3 1 4 2 1 4 2 1 4 1 2 1 3 其中 4 是行数和列数。我希望能够将该信息存储在矩
octave - 在 Octave 上设置曲面图的透明度
我正在运行 Octave 3.4.0 并想创建一个透明的曲面图。但是，我在处理 facealpha 时无法这样做。 , edgealpha , alphadata和 alphadatamapping
octave - 如何获取以 Octave 安装的软件包的功能列表？
安装一个包后，查找该包中有哪些功能的命令是什么？例如，我有 control安装包。但是如何找到关于这个包的帮助，比如它包含哪些函数等等，就像使用 Matlab 一样？是否必须去http://oct
octave - 如何配置 Octave 终端以输出没有科学计数法的数字？
我正在尝试在 Octave 音程终端中打印一长串数字。 disp(vec); 我得到的 7.0931e-01 6.2041e-05 9.7740e-01 9.9989e-01 8.8428e-01 9
octave - 安装 Octave 音阶时发生错误
我试图在OS X上安装Octave。执行brew install octave时，出现以下错误: octave: A LaTeX distribution is required to install
octave - 增加 Octave 音阶图例中的字体大小？
有人知道如何在 Octave 中增加图例字体大小吗？最佳答案这对我有用(kubuntu 9.04， Octave 3.2.2) print("plot.eps","-deps", "-F:30")
octave - 如何在 Octave 中增加命令窗口的字体大小
我试图弄清楚如何增加命令窗口文本。我想出了legend: legend('{\fontsize{10} Low }', '{\fontsize{10} Medium }', '{\fontsize{

首页

博学

6Ren·AI

商城

matlab/octave - 广义矩阵乘法

比较

额外

接下来要尝试什么？