gpt4 book ai didi

matlab - 如何删除双数组中的重复行,以便没有一行与其前一行相同

转载 作者:行者123 更新时间:2023-12-01 23:37:11 24 4
gpt4 key购买 nike

我有 4 个 n×1 列向量,其中共享相同的索引号意味着它们具有相同的时间戳。我想删除与其前面的“行”相同的“行”,并想象递归执行此操作直到没有变化。

例如,假设4个向量是

C1=[1;1;3;3;1;1];
C2=[2;2;4;4;2;2];
C3=[0;0;0;0;0;0];
C4=[5;5;6;6;5;5];

期望的输出是

ans=[1;3;5];

因为 [C1(ans),C2(ans),C3(ans),C4(ans)] 是一个数组,没有行与其前一行相同。在上面的示例中,生成的向量如下所示:

C1=[1;3;1];
C2=[2;4;2];
C3=[0;0;0];
C4=[5;6;5];

“行”,如查看使用 [C1,C2,C3,C4] 按列连接的向量时的行。

问题:

  • 我知道如何使用循环来完成它。您如何使用原生 Matlab 函数做到这一点?

一些注意事项:

我从 4 个分离的列向量开始的原因如下:

  1. 我有另一个包含唯一元素的 n×1 向量,我将根据为其他 4 个向量删除的索引删除相同的“行”;

  2. 在我的应用程序中,数据从其他地方检索并逐个元素存储到 Maltab 数据类型中以供进一步处理,我遇到了存储到 4 N-by-1 双倍存储到 1 N-by 的性能优势-4 双。这个 N 是几十万或几百万。

n 通常一次只有几千,但我需要将每次过滤所花费的时间尽可能减少到 1 秒内,并尽可能小。

(我想学习使用原生函数的方法并比较性能。)


性能说明

由于随机数据不合适,过于具体的数据也不合适,因此要证明这一点的性能差异有点困难。 (所谓困难,我的意思是快速很难做到。)

但万一有人感兴趣,表有 ~164k 行和只有 ~1k“唯一”行,(“”围绕行,)timeit() 的结果如下如下。

  • Cris 的diff or 方法:0.0028s

  • Wolfie 的独特方法:0.0142s

  • Wolfie 的arrayfun 方法:0.3912s

  • Thomas 的diff*ones 方法:0.0057s

  • Thomas 的递归方法:无法完成。这在 timeit() 下执行后一分钟内将 Matlab 的 RAM 请求增加到 ~70GB,并导致我的 Win 10 机器上的 UI 卡住,尽管该机器有很多未使用的 CPU。

  • 循环(但在列数上使用 varargin):3.6313s

如果不直接处理列,测试功能包括连接。

循环版本是:

function varargout = accum(varargin)

for i=1:numel(varargin)
varargout{i}=varargin{i}(1); % assuming single column
end

for i=2:numel(varargin{1}) % assuming equal length
TF=false;
for j=1:numel(varargin)
TF=TF||varargin{j}(i)~=varargin{j}(i-1);
end
if TF
for j=1:numel(varargin)
varargout{j}=[varargout{j};varargin{j}(i)];
end
end
end

end

如果您正在撰写另一个答案并需要样本数据,请告诉我。否则,我会跳过粘贴它,因为这样做没什么用。

最佳答案

我认为以下给出了所需的输出(未测试):

find([1; diff(C1) | diff(C2) | diff(C3) | diff(C4)])

diff 在两个后续元素不同的情况下为非零值。使用逻辑或,我们要求任何一个向量在任何一个位置都有差异。第一个元素始终是输出的一部分。 find 返回非零元素的索引。

关于matlab - 如何删除双数组中的重复行,以便没有一行与其前一行相同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65384350/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com