gpt4 book ai didi

matlab - 加速巨大稀疏矩阵的条件填充

转载 作者:太空宇宙 更新时间:2023-11-03 19:45:07 24 4
gpt4 key购买 nike

我想知道是否有一种方法可以加快(可能通过矢量化?)巨大稀疏矩阵(例如 ~ 1e10 x 1e10)的条件填充。这是我有一个嵌套循环的示例代码,仅当满足特定条件时我才填充稀疏矩阵:

% We are given the following cell arrays of the same size:
% all_arrays_1
% all_arrays_2
% all_mapping_arrays

N = 1e10;

% The number of nnz (non-zeros) is unknown until the loop finishes
huge_sparse_matrix = sparse([],[],[],N,N);

n_iterations = numel(all_arrays_1);

for iteration=1:n_iterations

array_1 = all_arrays_1{iteration};
array_2 = all_arrays_2{iteration};

mapping_array = all_mapping_arrays{iteration};

n_elements_in_array_1 = numel(array_1);
n_elements_in_array_2 = numel(array_2);

for element_1 = 1:n_elements_in_array_1

element_2 = mapping_array(element_1);

% Sanity check:
if element_2 <= n_elements_in_array_2
item_1 = array_1(element_1);
item_2 = array_2(element_2);

huge_sparse_matrix(item_1,item_2) = 1;
end
end
end

我正在努力对嵌套循环进行矢量化。据我了解,当要填充的条目数很大(~100M)时,逐个元素填充稀疏矩阵非常慢。我需要使用稀疏矩阵,因为它的尺寸在 10,000M x 10,000M 范围内。然而,这种在MATLAB中填充稀疏矩阵的方式非常慢。

编辑:

我更新了变量的名称以更好地反射(reflect)它们的性质。没有函数调用。

附录:

这段代码为一个巨大的图构建矩阵邻接。变量 all_mapping_arrayslocal representation 保存图节点之间的映射数组(~邻接关系),这就是为什么我需要 array_1array_2 将邻接映射到全局表示。

最佳答案

我认为这将是稀疏矩阵的增量更新,而不是基于循环的条件会减慢速度。

当您通过类似 A(i,j) = 1 的方式向稀疏矩阵添加新条目时,通常需要重新打包整个矩阵数据结构。这是一项昂贵的操作。如果您有兴趣,MATLAB 在内部使用 CCS 数据结构(压缩列存储),数据结构 部分 here 对此进行了描述.注意语句:

This scheme is not effcient for manipulating matrices one element at a time

通常,将矩阵中的非零项累积为一组三元组然后调用 sparse 会好得多(快得多)。例如(警告——脑编译代码!!):

% Inputs:
% N
% prev_array and next_array
% n_labels_prev and n_labels_next
% mapping

% allocate space for matrix entries as a set of "triplets"
ii = zeros(N,1);
jj = zeros(N,1);
xx = zeros(N,1);
nn = 0;

for next_label_ix = 1:n_labels_next

prev_label = mapping(next_label_ix);

if prev_label <= n_labels_prev
prev_global_label = prev_array(prev_label);
next_global_label = next_array(next_label_ix);

% reallocate triplets on demand
if (nn + 1 > length(ii))
ii = [ii; zeros(N,1)];
jj = [jj; zeros(N,1)];
xx = [xx; zeros(N,1)];
end

% append a new triplet and increment counter
ii(nn + 1) = next_global_label; % row index
jj(nn + 1) = prev_global_label; % col index
xx(nn + 1) = 1.0; % coefficient
nn = nn + 1;
end
end

% we may have over-alloacted our triplets, so trim the arrays
% based on our final counter
ii = ii(1:nn);
jj = jj(1:nn);
xx = xx(1:nn);

% just make a single call to "sparse" to pack the triplet data
% as a sparse matrix object
sp_graph_adj_global = sparse(ii,jj,xx,N,N);

我一次分配 N 个条目。假设您对矩阵的结构了解很多,您可能可以在此处使用更好的值。

希望这对您有所帮助。

关于matlab - 加速巨大稀疏矩阵的条件填充,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7166758/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com