performance - 通过交错复制 3D 阵列的页面构建邻接矩阵-6ren

performance - 通过交错复制 3D 阵列的页面构建邻接矩阵

转载作者：行者123 更新时间：2023-12-03 16:59:23

27

4

背景
我正在尝试建模一个可以在每个时间步更改其配置的系统。各种配置是预先知道的，不依赖于时间步长。在某些配置之间允许转换，而在其他配置之间禁止转换。目标是构建一个跨越多个时间步长的允许转换的邻接矩阵。
环境
让 A成为 s*s*k表示允许转换的逻辑矩阵，以及 A1...Ak代表 A 的页面/切片:

A1 = A(:,:,1); A2 = A(:,:,2); ... Ak = A(:,:,k);

第三维的含义是一个过渡需要多少个时间步，例如:if A(1,3,2)非零，表示状态 #1可以转换到状态 #3这将需要 2时间步骤。
让 B是我们要构建的邻接矩阵，表示 nt时间步骤。 B的形状应该是示意性的(以块矩阵表示法):

     _                                   _
    | [0] [A1] [A2] ... [Ak] [0]  ... [0] |
B = | [0] [0]  [A1] [A2] ... [Ak] ... [0] |
    |  ⋮    ⋮     ⋱    ⋱      ⋱       ⋮  |
    |_[0] [0]  …  …  …  …  …  …  …  … [0]_| "[A1] [A2] ... [Ak]"

其中主块对角线由 nt 组成0 块，以及 A 的切片逐渐向右“推”直到“时间用完”， A的切片最终在 B 的“外部” ⇒ 表示没有更多的转换是可能的。自 B由 nt*nt 组成 s*s块，其大小为 (nt*s)×(nt*s) .

Question: Given A and nt, how can we construct B in the most CPU- and memory-efficient way?

笔记

自 B主要用零填充，它可能是有意义的 sparse .

在我的应用程序中，CPU 效率(运行时)比内存效率更重要。

在真正的问题中，s=250和 nt=6000 .

欢迎使用外部脚本/类/工具。

我的一个想法不是构建最初交错的矩阵，而是具有 [A1] 的主对角线块和 circshift -ing 和掩蔽，当其他一切都完成时。

演示 + Naïve 实现

s = 3; k = 4; nt = 8;
A = logical(cat(3, triu(ones(s)), eye(s), zeros(s), [0 0 0; 0 0 0; 0 1 0]));
% Unwrap A (reshape into 2D):
Auw = reshape(A, s, []);
% Preallocate a somewhat larger B:
B = false(nt*s, (nt+k)*s);
% Assign Auw into B in a staggered fashion:
for it = 1:nt
  B( (it-1)*s+1:it*s, it*s+1:(it+k)*s ) = Auw;
end
% Truncate the extra elements of B (from the right)
B = B(1:nt*s, 1:nt*s);
spy(B);

导致:

最佳答案

一种解决方案是使用隐式扩展来计算所有索引:

% Dev-iL minimal example
s = 3; k = 4; nt = 8;
A = logical(cat(3, triu(ones(s)), eye(s), zeros(s), [0 0 0; 0 0 0; 0 1 0]));
Auw = reshape(A, s, []);

% Compute the indice:
[x,y] = find(Auw);
x = reshape(x+[0:s:s*(nt-1)],[],1);
y = reshape(y+[s:s:s*nt],[],1);

% Detection of the unneeded non zero elements:
ind = x<=s*nt & y<=s*nt;

% Sparse matrix creation:
S = sparse(x(ind),y(ind),1,s*nt,s*nt);

% Plot the results:
spy(S)

这里我们只计算非零值的位置。我们避免预先分配一个会减慢计算速度的大矩阵。
基准:
我已经在线使用matlab运行基准测试，可用内存有限。如果有人会在他的本地计算机上以更大的值(value)运行基准测试，请随意这样做。
enter image description here

使用这些配置，使用隐式扩展似乎确实更快。
基准代码:

for ii = 1:100
    s   = ii; k = 4; nt = ii;
    Auw = rand(s,s*k)>0.75;

    f_expa = @() func_expansion(s,nt,Auw);
    f_loop = @() func_loop(s,k,nt,Auw);

    t_expa(ii) = timeit(f_expa);
    t_loop(ii) = timeit(f_loop);
end

plot(1:100,t_expa,1:100,t_loop)
legend('Implicit expansion','For loop')
ylabel('Runtime (s)')
xlabel('x and nt value')

% obchardon suggestion
function S = func_expansion(s,nt,Auw)
    [x,y] = find(Auw);
    x = reshape(x+[0:s:s*(nt-1)],[],1);
    y = reshape(y+[s:s:s*nt],[],1);
    ind = x<=s*nt & y<=s*nt;
    S = sparse(x(ind),y(ind),1,s*nt,s*nt);
end

% Dev-il suggestion
function B = func_loop(s,k,nt,Auw)
    B = false(nt*s, (nt+k)*s);
    for it = 1:nt
        B( (it-1)*s+1:it*s, it*s+1:(it+k)*s ) = Auw;
    end
    B = B(1:nt*s, 1:nt*s);
end

关于performance - 通过交错复制 3D 阵列的页面构建邻接矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/63171491/

27

4

0

文章推荐： vespa - 在 vespa 中禁用缓存

文章推荐： angular-testing-library:getByRole 查询仅适用于 hidden: true 选项

文章推荐： Xamarin.Forms.Application.Current.MainPage 为 null

java - MagicEightBall 阵列
我有一个关于将字符串分配给数组编号的问题。我已经声明了字符串数组，例如。 String[] answer = {"yes", "no", "maybe"}; 如何在不使用这种方法的情况下将每个字符串
Android Firebase 阵列
我正在为云数据库使用 Firebase 编写一个 Android 应用程序。它基本上是一个多项选择调查问题应用程序。导入到我的 Firebase { "multiple_choice" : {
从输入文件创建 3D 阵列？
我想将输入文件中的以下行存储到 3D 数组中(不包括第一行。)第一行表示后续行的数量。 3 4 9368 86 843 23224 4 7323 2 2665 2665 8447 47 843 527
c++ - 选择性能最高的容器(阵列)
这是我关于容器的小大问题，尤其是数组。我正在编写一个物理代码，主要操纵一大组(> 1 000 000)“粒子”(每个粒子有 6 个 double 坐标)。我正在寻找最佳方式(在性能方面)来实现一个类
angular - RouterLink 阵列
我有一个超链接，我需要在 Angular 4 中创建一个路由器链接。我有很多部分指向 url，其中一部分是一个数组。我不确定如何让数组将自己拆分成 routerlink 数组的部分。以这个人为的例子
用于轮式选择器的 Android 阵列
大家好，我有一个轮子选择器在工作，但目前它正在为所有轮子提取 0-9 的数字。我希望能够设置值而不是 0-9 我希望它是从数组或字符串中提取的单词，所以我可以输入它们 myslef 因为我不确定目前从
javascript - 进入 Spotify 阵列
我正在尝试使用 Spotify API 并进入数组。 const App = () => { const [isLoading, setIsLoading] = useState(true);
java - 井字棋 - 2D 阵列
我尝试创建 Tic Tac Toe，我能够填满我的棋盘，并且能够检查行和列以确定谁获胜。然而，我需要一些帮助来检查对角线，看看谁赢了。这是我到目前为止所拥有的。我是初学者，所以请不要让代码太难。检查
vhdl - 初始化动态 VHDL 阵列
--in the package type t_array is array (natural range <>) of std_logic_vector (7 downto 0); type p_a
arrays - 无法访问私有(private)阵列
我在访问字符串数组时遇到困难。它被声明为私有(private)数组并填充在类的构造函数中。我定义了一个 Get 函数。问题是当我在编译时调用此函数时出现错误，提示我无法访问在类中声明的私有(priva
perl - 访问 Moose 阵列
无法弄清楚推送到 Moose 数组的语法(我确信这很明显，而且我很愚蠢)。这是 this question 的延续.在我看来，对于我的具体情况，我需要的不仅仅是一个简单的值。尝试使用 Moose 式的
python - 刺穿 3D 阵列
我有一个 3d 数组，我正在尝试从中获取刺伤列表。换句话说，给定数组: t = np.array([[[1,2],[3,4]],[[5,6],[7,8]],[[9,10],[11,12]]]) arr
python - 直接体积图 3D 阵列
我正在寻找绘制一个 3 维数组。有没有一种方法可以直接输入数组，绘制体素并在 3d 数组中的位置产生的坐标处绘制实际值(颜色)？到目前为止我发现的所有方法(例如 ax.voxels、mlab.poin
javascript - 阵列中的 knockout 阵列
我正在尝试使用 Knockout 创建一个简单的电子表格。我试图让每个单元格都可观察，以便在发生变化时，我可以评估值并进行相应的计算。因此，如果他们在单元格中输入 6+7，我可以评估并将该值更改为总数
arrays - swift 阵列。尝试根据当前时间查找数组中的下一个时间
我有当前时间和这组时间。我想计算出下一次与当前时间最接近的时间。 let date = NSDate() let calendar = NSCalendar.currentCalendar() let
java - 如何创建随机分布在阵列上的图像的 2D 阵列？
我想在我的小程序中创建一个二维图像数组。我需要一个 4x4 网格，其中有 4 个图像，每个图像 4 个随机分布在阵列中。这里有一些答案，但我不明白如何使用它们。最佳答案您可以声明 Image[][
php - 具有独特提交按钮的 echo 阵列
基本上，此代码列出了“可用”挑战，其中 complete = 0 并在每个列表中都有一个接受submit 按钮。到目前为止，我一次只能列出一项，因为列出的多个按钮无法识别匹配 ID $echo 任何人
javascript - 阵列 Angular 动态滤波器
我正在尝试创建一个带有动态变量的过滤数组。我创建一个包含过滤器键的数组，然后创建一个过滤后的数组，该数组只应返回与第一个数组中的键匹配的项目。带有过滤器键的数组:$scope.participant
javascript - DNA 配对、阵列
我是一个相对年轻的开发人员，我对一些事情感到困惑。这是我的代码: function pairElement(str) { var arr = []; var pairs = [
javascript - 连接 firebase 阵列？
我正在 Angular 中创建一个函数，我想抓取所有博客文章，其类别与单击的按钮相匹配，我的 Firebase 中有 3 个不同的字段，标题为类别 1、类别 2 和类别 3。例如，当用户单击新闻通讯时

首页

博学

6Ren·AI

商城

performance - 通过交错复制 3D 阵列的页面构建邻接矩阵