gpt4 book ai didi

matlab - 如何将 `find` 命令替换为 `logical indexing` (MATLAB),以查找唯一值的向量值位置?

转载 作者:太空宇宙 更新时间:2023-11-03 19:31:45 25 4
gpt4 key购买 nike

在 MATLAB 中,我有一个 for 循环,它有很多交互要经过并填充一个稀疏矩阵。该程序非常慢,我想对其进行优化以使其尽快完成。在两行中,我使用命令 find,MATLAB 的编辑器警告我使用 logical indexing 而不是 find 会提高性能.我的代码与提供给 Mathworks 新读者 mathworks newsreader recommendation 的代码非常相似,其中有一个值向量和一个从中生成的唯一值向量。使用 find 获取唯一值中的索引(用于更新矩阵中的值)。简而言之,给出的代码是:

     positions = find(X0_outputs == unique_outputs(j,1));
% should read
positions = X0_outputs == unique_outputs(j,1);

但最后一行不是索引,而是一个由 0 和 1 组成的向量。我有一个说明性的例子,制作一组索引; tt=round(rand(1,6)*10):

 tt = 3     7     1     7     1     7

做一个唯一的向量; ttUNI=unique(tt)

ttUNI = 1     3     7

使用find获取值在唯一值集合中的位置索引; 查找(ttUNI(:) == tt(1))

ans = 2

与使用逻辑索引比较; (ttUNI(:) == tt(1))

ans =
0
1
0

当我需要更新矩阵的索引时,具有值 2 比二进制向量有用得多。对于我的矩阵,我可以说 mat(find(ttUNI(:) == tt(1)), 4) 就可以了。而使用 (ttUNI(:) == tt(1)) 需要后期处理。

是否有一种简洁高效的方法来完成所需的工作?或者在这些情况下使用 find 是不可避免的吗?

更新:我将在此处包含用户推荐的代码:@Jonas 以便更好地了解我遇到的问题并报告一些分析器工具的结果.

ALL_NODES = horzcat(network(:,1)',network(:,2)');
NUM_UNIQUE = unique(ALL_NODES);%unique and sorted
UNIQUE_LENGTH = length(NUM_UNIQUE);
TIME_MAX = max(network(:,3));
WEEK_NUM = floor((((TIME_MAX/60)/60)/24)/7);%divide seconds for minutes, for hours, for days and how many weeks
%initialize tensor of temporal networks
temp = length(NUM_UNIQUE);
%making the tensor a sparse 2D tensor!!! So each week is another replica of
%the matrix below
Atensor = sparse(length(NUM_UNIQUE)*WEEK_NUM,length(NUM_UNIQUE));
WEEK_SECONDS = 60*60*24*7;%number of seconds in a week

for ii=1:size(network,1)%go through all rows/observations
WEEK_NOW = floor(network(ii,3)/WEEK_SECONDS) + 1;
if(WEEK_NOW > WEEK_NUM)
disp('end of weeks')
break
end
data_node_i = network(ii,1);
Atensor_row_num = find(NUM_UNIQUE(:) == data_node_i)...
+ (WEEK_NOW-1)*UNIQUE_LENGTH;
data_node_j = network(ii,2);
Atensor_col_num = find(NUM_UNIQUE(:) == data_node_j);
%Atensor is sparse
Atensor(Atensor_row_num,Atensor_col_num) = 1;
end

此处 UNIQUE_LENGTH = 223482size(network,1)=273209。我用 profiler 工具 运行了几分钟,这时间不足以让程序完成,但在时间比例不会变化太大的情况下达到稳定状态。 Atensor_row_num = find(NUM_UNI..45.6%Atensor_col_num = find(NUM_UNI...43.4% . Atensor(Atensor_row_num,Atenso... 分配值给稀疏矩阵的那一行,只有8.9%NUM_UNIQUE 向量非常大,所以 find 是代码的一个重要方面;甚至比稀疏矩阵操作更重要。这里的任何改进都会很重要。我不知道是否有更有效的逻辑进程让该算法继续进行,而不是采用直接替换 find 的方法。

最佳答案

find 在某些情况下确实是不可避免的。例如,如果你想遍历索引,即

idx = find(someCondition);
for i = idx(:)'
doSomething
end

或者如果你想做多级索引

A = [1:4,NaN,6:10];
goodA = find(isfinite(A));
everyOtherGoodEntry = A(goodA(1:2:end));

或者如果你想要前 n 个好的值

A = A(find(isfinite(A),n,'first');

在您的情况下,您可以通过使用 unique 的附加输出来避免调用 find

[uniqueElements,indexIntoA,indexIntoUniqueElements] = unique(A);

在您尝试通过修复您认为需要时间的问题来优化您的代码之前,我建议您对您的代码运行探查器以检查真正需要时间的部分。然后您可以发布实际循环的代码,我们可能会提供帮助。

关于matlab - 如何将 `find` 命令替换为 `logical indexing` (MATLAB),以查找唯一值的向量值位置?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9464402/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com