concurrency - 大矩阵求逆-6ren

concurrency - 大矩阵求逆

转载作者：行者123 更新时间：2023-12-03 14:03:19

26

4

我正在看一个大型矩阵的逆矩阵，通常大小为1000 x 1000，但有时超过100000 x 100000（由于时间和内存的原因，当前失败）。我知道正常的情绪是“不要采取相反的态度，找到其他方法来做到这一点”，但目前尚不可能。这样做的原因是由于使用了预期会求逆矩阵的软件。（注意：我正在研究更改方法，但这将需要很长时间）

目前，我们正在使用来自数值复制的LU分解方法，而我目前正在测试特征库。本征库似乎更稳定且速度更快，但我仍处于测试阶段。我快速浏览了其他库，例如ATLAS和LAPACK，但尚未对它们进行任何实质性的测试。

似乎本征库没有使用并发方法来计算逆函数（尽管对于逆矩阵的LU分解部分也是如此），而且据我所知，ATLAS和LAPACK在此限制方面相似。（我目前正在测试使用openMP和不使用openMP时本征的速度差异。）

第一个问题是谁能解释如何通过并行化优化矩阵求逆。我找到了一篇文章here，它谈论矩阵求逆并行算法，但我不理解。看来this文章在谈论另一种方法？我也不确定scaLAPACK或PETSc是否有用？

第二个问题，我阅读了this有关使用GPU来提高性能的文章，但是我从来没有为GPU编写过代码，因此不知道要传达什么内容，但是底部的图表看起来相当令人震惊。如果这是真的，那怎么可能，以及如何开始实施类似的东西。

我还找到了this文章，还没有时间通读它来理解，但似乎很有希望，因为内存是我们软件的当前问题。

有关这些文章或一般问题的任何信息都将有很大帮助。如果这个问题含糊其辞，我再次表示歉意，如有必要，我将尝试扩大范围。

最佳答案

第一个问题是谁能解释如何通过并行化优化矩阵求逆。

我可能会猜测，这以及线性代数中的相关主题是并行计算中研究最多的主题之一。如果您一直在寻找可以开始阅读的地方，那么不错的老Golub and Van Loan会在该主题上有一章。至于Scalapack和Petsc是否可能有用，肯定是前者，也许是后者。当然，它们都依赖MPI，但这在该领域中是理所当然的。

第二个问题...

如果有GPU，请使用它们，并且您有能力将代码转换为GPU支持的编程模型。如果您从未为GPU进行编码并且可以访问商品型CPU集群，那么使用集群将比使用新颖技术更快地加快速度。

至于您所提到的上一篇文章，它在一个变化非常快的领域中已有10年的历史了（尝试找到有关使用GPU进行矩阵求逆的10年历史的研究论文）。我无法评论它的卓越性或其他属性，但是在我看来，您提到的问题大小在现代群集的核内（使用旧术语）计算能力范围内。如果矩阵很大，它们是否也稀疏？

最后，我强烈支持您明显的意图，即使用现有的现成代码，而不是尝试开发自己的代码。

关于concurrency - 大矩阵求逆，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11230067/

26

4

0

文章推荐： reactjs - setState 方法导致 Reactjs 函数中的结果无限循环

文章推荐： python-3.x - 导入错误 : No module named 'scipy._lib'

文章推荐： r - 在 R Markdown 中为代码块添加换行符

javascript - 求 for 循环中变量的迭代总和
for (i = 0; i <= 1000; i++) { if ( i % 3 === 0){ console.log(i); } if ( i % 5 ==
arrays - 求 A[i] 与常数之差的最小总和
对于一项作业，我需要解决一个数学问题。我将其缩小为以下内容: 令 A[1, ... ,n] 为 n 整数数组。令y 为整数常量。现在，我必须编写一个算法，在 O(n) 时间内找到 M(y) 的最小
iOS 媒体播放器求
我可以使用 iOS MediaPlayer 并通过这种方式播放电影。但我需要，寻找一秒钟的电影。我该怎么做，我像这样通过 MediaPlayer 播放电影: NSURL *videoURL =
embedded - 求(价格合理)eCos开发板
我听说过 eCos看起来作为一个爱好项目来玩会很有趣。任何人都可以推荐一个价格合理的开发板。如果它不会增加太多成本，我想要几个按钮来按下(并以编程方式检测按下)和一些调试输出的 LCD。以太网会很好
c - 求 k 素数的个数；
给定 a 到 b 的范围和数字 k ，找到 a 到 b [包括两者]之间的所有 k-素数。 k-素数的定义:如果一个数恰好有 k 个不同的素数因子，则该数是 k-素数。即 a=4 , b=10 k=
delphi - 求(免费)网络编程框架
这是对 my previous question 的重新措辞尝试作为它收到的反馈的结果。我想要一个简单的网络通信，我可以将其用作底层框架，而无需再次查看。我只想将一个字符串从一台 PC 推送到另一台
arangodb - 求 ArangoDB 中节点数的交叉节点？
我有许多节点通过其他类型的中间节点连接。如图所示，中间节点可以有多个。我需要找到给定数量的节点的所有中间节点，并按初始节点之间的链接数量对其进行排序。在我的示例中，给定 A、B、C、D，它应该返回节点
java - 求 5x5 数组的和
我的代码遇到问题。我试图找到这个 5x5 数组的总和，但它总是给我总计 0。当我使用 2x2 数组时，它可以工作，但对于 5x5 数组则不起作用。有人可以帮忙吗？ import java.util.*
java - 求 BST 中数组元素的层数
我们有一个给定的数组，我们想要打印 BST 中每个节点的级别。例如，如果给定数组为:{15, 6, 2, 10, 9, 7, 13} 那么答案是: 1 2 3 3 4 5 4 (表示存储15的节点级
r - 求 r 中无限和的值
我对 R 和编程非常陌生，所以请留在我身边:) 我正在尝试使用迭代来查找无限迭代到小数点后第四位的值。 IE。其中小数点后第四位不变。所以 1.4223，其中 3 不再改变，所以小数点后 3 位的结果
c - 求 2 的幂的优雅方法
我的问题与 Fastest way of computing the power that a "power of 2" number used? 非常相似: 将 x=2^y 作为输入，我想输出 y。
matlab - 求 3 个数字之间的最小值
如何找到三个非零数字中最小的一个。我尝试引入一个非常小的数字eps = 1e-6(我的数字为零或明显大于eps)并在min(x,eps)、min(y,eps)之间进行测试)等我什么也没得到。有没有办
java - 求 boolean 矩阵中最大区域的长度
我有一个类(class)，他们计算矩阵中最大的“1”岛，但他的岛概念是“如果两个单元在水平、垂直或对角线上彼此相邻，则称它们是相连的。 “ 我需要帮助来删除对角台阶。 class GFG {
python - 求 Petersen 子图中的哈密顿路径
我开始使用 IDE Jupyter && Python 3.6 并出现了一个问题。我必须通过IDE绘制Petersen子图中的哈密顿路径，但我不知道该怎么做。我显示有关该图的信息: Petersen
java - 求 2000000 以下的素数之和
public static void main(String[] args) { int sum = 2; int isPrime; for(int x = 3; x Mat
java - 求 200 万以下所有素数的和
这个问题已经有答案了: 已关闭10 年前。 Possible Duplicate: How much time should it take to find the sum of all prime
java - 求 BST 中节点到根的距离
我想找到给定节点到链表二叉搜索树中根的距离。我有下面的代码来计算树的高度(root.getHeightN())，从根到叶子，但我现在需要的是从叶子到根。 public int getHeightN()
python - 求 k 最近邻图的连通分量的数量？
是否有一种优雅的方法使用预先计算的 KDTree 来查找连接组件的数量？现在使用呼吸优先搜索算法以及 k 最近邻的 KDTree 给出的邻接矩阵来查找连接的组件，但是是否有更好的可能性？ import
javascript - 求 angular2 中同名对象数组的值之和
我有一个要求，我需要找到具有相同名称的不同对象中 amt 值的总和。下面是代码片段 traveler = [ { description: 'Senior', Amount: 50}, {
python - 求 pandas 中某些列的总和
我正在尝试使用 pandas 对某些列进行求和，同时保留其他列。例如: member_no, data_1, data_2, data_3, dat_1, dat_2, other_1, other_

首页

博学

6Ren·AI

商城

concurrency - 大矩阵求逆