gpt4 book ai didi

performance - 为什么访问存储在单元格中的数据的时间比存储在矩阵中的时间短?

转载 作者:太空宇宙 更新时间:2023-11-03 20:03:10 24 4
gpt4 key购买 nike

我在 matlab 中处理非常大的数据,并用于将这些数据存储在矩阵中。我曾经按行存储数据,但由于 Matlab 按列存储数据,我明白 reshape 矩阵以便按列索引可以加快处理速度。这是我的意思的一个例子:


一般参数

nbr_channels = 20;
nbr_samples_per_channel = 3200000;
fake_data = randn(1, nbr_samples_per_channel);
ROI = 1200000 : 2800000;

按行分配数据

data = nan(nbr_channels, nbr_samples_per_channel);
tic;
for j = 1 : nbr_channels
data(j, 1:nbr_samples_per_channel) = fake_data;
end;
toc;

% Elapsed time is 1.476525 seconds.

从行矩阵返回数据

tic; 
for j = 1 : nbr_channels
bla = data(j, ROI);
end;
toc;

% Elapsed time is 0.572162 seconds.

返回行矩阵中的所有数据

tic; 
for j = 1 : nbr_channels
bla = data(j, :);
end;
toc;

% Elapsed time is 0.589489 seconds.

按列分配数据

data = nan(nbr_samples_per_channel, nbr_channels);
tic;
for j = 1 : nbr_channels
data(1:nbr_samples_per_channel, j) = fake_data;
end;
toc;

% Elapsed time is 0.299682 seconds.

从列矩阵返回数据

tic; 
for j = 1 : nbr_channels
bla = data(ROI, j);
end;
toc;

% Elapsed time is 0.260824 seconds.

返回列矩阵的所有数据

tic; 
f or j = 1 : nbr_channels
bla = data(:, j);
end;
toc;

% Elapsed time is 0.092983 seconds.

第 1 部分摘要:

正如我们所见,按列访问数据可将处理时间至少减少两倍!

但我不明白为什么细胞的效率更高!看看这个例子:

按单元分配数据

data = cell(1, nbr_samples_per_channel);
tic;
for j = 1 : nbr_channels
data{j} = fake_data;
end;
toc;

% Elapsed time is 0.000013 seconds.

从元胞数组返回数据

tic; 
for j = 1 : nbr_channels
bla = data{j}(ROI);
end;
toc;

% Elapsed time is 0.260294 seconds.

返回元胞数组的所有数据

tic; 
for j = 1 : nbr_channels
bla = data{j};
end;
toc;

% Elapsed time is 0.000022 seconds.

%%

第 2 部分摘要:

这比我在第 1 部分中展示的要快几个数量级。

问题一

为什么访问存储在单元格中的数据的时间比存储在矩阵中的数据的时间短?

问题二

使用矩阵通常比使用单元格更容易,因为使用矩阵就可以做到

my_matrix(100:20000, 1:3)

但是对于单元格我不能这样做(据我所知)。关于如何同时从多个单元格返回特定元素的任何替代方案?

最佳答案

您看到的时间不同,因为您没有做相同的事情。比较您的两个案例:

按单元分配数据

  • 您正在创建一个元胞数组行向量,并将一个长 double 向量填充到每个元胞

  • 每次循环迭代都会将一个向量分配到元胞数组中的单个槽中

  • 有 'nbr_samples_per_channel' 个分配正在完成。

按列分配数据

  • 您正在遍历矩阵的列,并为每列中的每个元素分配一个向量

  • 无论您使用的速记冒号 : 符号如何,每次循环迭代都会解析为许多赋值。 data(1:nbr_samples_per_channel, j) 表示每次迭代的“nbr_samples_per_channel”分配。

  • 总体而言,您正在执行 'nbr_samples_per_channel' * 'nbr_channels' 总分配。

为了说明我的观点,只需重写没有冒号运算符的循环即 cocoa 视化所有赋值。

for j = 1 : nbr_channels    

n = length(fake_data)

data(1, j) = fake_data(1);
data(2, j) = fake_data(1);

... etc ...

data(n - 1, j) = fake_data(n-1);
data(n, j) = fake_data(n);

end

因此,总而言之,您正在比较两种不同的事物,因此您不能说一个真的比另一个快,因为它们并不等同。

如果您只是遍历一个 double 组和一个元胞数组,并进行常规赋值....

%% Setup samples and pre-allocate
numberOfSamples = 100000;

doubleData = nan(numberOfSamples, 1);
cellData = cell(numberOfSamples, 1);

randomValues = rand(numberOfSamples, 1);

%% Assign N number of values to a double array
tic;
for idx = 1 : numberOfSamples
data(numberOfSamples) = randomValues(idx);
end
doubleTime = toc;

%% Assign N number of values to a cell array
tic;
for idx = 1 : numberOfSamples
cellData{numberOfSamples} = randomValues(idx);
end
cellTime = toc;

disp(sprintf('Double Array: %f seconds', doubleTime));
disp(sprintf('Cell Array: %f seconds', cellTime));

你最终得到:

Double Array: 0.006073 seconds
Cell Array: 0.032966 seconds

关于你的第二个问题,这是你想要做的吗?

>> bigCell = {1 2 3 4; 5 6 7 8; 9 10 11 12; 13 14 15 16}

bigCell =

[ 1] [ 2] [ 3] [ 4]
[ 5] [ 6] [ 7] [ 8]
[ 9] [10] [11] [12]
[13] [14] [15] [16]

>> subCell = bigCell(1:2, 3:4)

subCell =

[3] [4]
[7] [8]

请注意子单元格仍然是一个单元格。通过使用 ( ) 而不是 { } 访问单元格,您可以将其保留为单元格。

关于performance - 为什么访问存储在单元格中的数据的时间比存储在矩阵中的时间短?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8066077/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com