- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在看一个大型矩阵的逆矩阵,通常大小为1000 x 1000,但有时超过100000 x 100000(由于时间和内存的原因,当前失败)。我知道正常的情绪是“不要采取相反的态度,找到其他方法来做到这一点”,但目前尚不可能。这样做的原因是由于使用了预期会求逆矩阵的软件。 (注意:我正在研究更改方法,但这将需要很长时间)
目前,我们正在使用来自数值复制的LU分解方法,而我目前正在测试特征库。本征库似乎更稳定且速度更快,但我仍处于测试阶段。我快速浏览了其他库,例如ATLAS和LAPACK,但尚未对它们进行任何实质性的测试。
似乎本征库没有使用并发方法来计算逆函数(尽管对于逆矩阵的LU分解部分也是如此),而且据我所知,ATLAS和LAPACK在此限制方面相似。 (我目前正在测试使用openMP和不使用openMP时本征的速度差异。)
第一个问题是谁能解释如何通过并行化优化矩阵求逆。我找到了一篇文章here,它谈论矩阵求逆并行算法,但我不理解。看来this文章在谈论另一种方法?我也不确定scaLAPACK或PETSc是否有用?
第二个问题,我阅读了this有关使用GPU来提高性能的文章,但是我从来没有为GPU编写过代码,因此不知道要传达什么内容,但是底部的图表看起来相当令人震惊。如果这是真的,那怎么可能,以及如何开始实施类似的东西。
我还找到了this文章,还没有时间通读它来理解,但似乎很有希望,因为内存是我们软件的当前问题。
有关这些文章或一般问题的任何信息都将有很大帮助。如果这个问题含糊其辞,我再次表示歉意,如有必要,我将尝试扩大范围。
最佳答案
第一个问题是谁能解释如何通过并行化优化矩阵求逆。
我可能会猜测,这以及线性代数中的相关主题是并行计算中研究最多的主题之一。如果您一直在寻找可以开始阅读的地方,那么不错的老Golub and Van Loan会在该主题上有一章。至于Scalapack和Petsc是否可能有用,肯定是前者,也许是后者。当然,它们都依赖MPI,但这在该领域中是理所当然的。
第二个问题...
如果有GPU,请使用它们,并且您有能力将代码转换为GPU支持的编程模型。如果您从未为GPU进行编码并且可以访问商品型CPU集群,那么使用集群将比使用新颖技术更快地加快速度。
至于您所提到的上一篇文章,它在一个变化非常快的领域中已有10年的历史了(尝试找到有关使用GPU进行矩阵求逆的10年历史的研究论文)。我无法评论它的卓越性或其他属性,但是在我看来,您提到的问题大小在现代群集的核内(使用旧术语)计算能力范围内。如果矩阵很大,它们是否也稀疏?
最后,我强烈支持您明显的意图,即使用现有的现成代码,而不是尝试开发自己的代码。
关于concurrency - 大矩阵求逆,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11230067/
假设我有两个矩阵,每个矩阵有两列和不同的行数。我想检查并查看一个矩阵的哪些对在另一个矩阵中。如果这些是一维的,我通常只会做 a %in% x得到我的结果。 match似乎只适用于向量。 > a
关闭。这个问题是opinion-based .它目前不接受答案。 想要改进这个问题? 更新问题,以便 editing this post 可以用事实和引用来回答它. 关闭 9 个月前。 Improv
我只处理过 DirectX 矩阵 我读过一些文章,说不能将 DirectX 矩阵数学库用于 openGL 矩阵。 但我也读过,如果你的数学是一致的,你可以获得类似的结果。那只会让我更加困惑。 任何人都
我编写了一个C++代码来解决线性系统A.x = b,其中A是一个对称矩阵,方法是首先使用LAPACK(E)对角矩阵A = V.D.V^T(因为以后需要特征值),然后求解x = A^-1.b = V^T
我遇到了问题。我想创建二维数组 rows=3 cols=2我的代码如下 int **ptr; int row=3; int col=2; ptr=new int *[col]; for (int i=
我有一个 3d mxnxt 矩阵,我希望能够提取 t 2d nxm 矩阵。在我的例子中,我有一个 1024x1024x10 矩阵,我想要 10 张图像显示给我。 这不是 reshape ,我每次只需要
我在 MATLAB 中有一个 3d 矩阵 (n-by-m-by-t) 表示一段时间内网格中的 n-by-m 测量值.我想要一个二维矩阵,其中空间信息消失了,只剩下 n*m 随着时间 t 的测量值(即:
作为一个简化的示例,我有一个 3D numpy 矩阵,如下所示: a = np.array([[[1,2], [4,np.nan], [7,
作为一个简化的示例,我有一个 3D numpy 矩阵,如下所示: a = np.array([[[1,2], [4,np.nan], [7,
使用 eigen2 , 并给定一个矩阵 A a_0_0, a_0_1, a_0_2, ... a_1_0, a_1_0, a_1_2, ... ... 和一个矩阵B: b_0_0, b_0_1, b_
我想知道如何获得下面的布局。 在中型和大型设备上,我希望有 2 行和 2 列的布局(2 x 2 矩阵)。 在小型(和超小型)设备上或调整为小型设备时,我想要一个 4 行和 1 列的矩阵。 我将通过 a
有什么方法可以向量化以下内容: for i = 1:6 te = k(:,:,:,i).*(c(i)); end 我正在尝试将 4D 矩阵 k 乘以向量 c,方法是将其
如何从填充有 1 和 0 的矩阵中抽取 n 个随机点的样本? a=rep(0:1,5) b=rep(0,10) c=rep(1,10) dataset=matrix(cbind(a,b,c),nrow
我正在尝试创建一个包含 X 个 X 的矩阵。以下代码生成从左上角到右下角的 X 对 Angular 线,而不是从右上角到左下角的 X 对 Angular 线。我不确定从哪里开始。是否应该使用新变量创建
我想在 python 中创建一个每行三列的矩阵,并能够通过任何一行对它们进行索引。矩阵中的每个值都是唯一的。 据我所知,我可以设置如下矩阵: matrix = [["username", "name"
我有点迷茫 我创建了一个名为 person 的类,它具有 age 和 name 属性(以及 get set 方法)。然后在另一个类中,我想创建一个 persons 数组,其中每个人都有不同的年龄和姓名
我有 n 个类,它们要么堆叠,要么不堆叠。所有这些类都扩展了同一个类 (CellObject)。我知道更多类将添加到此列表中,我想创建一种易于在一个地方操纵“可堆叠性”的方法。 我正在考虑创建一个矩阵
我有一个包含 x 个字符串名称及其关联 ID 的文件。本质上是两列数据。 我想要的是一个格式为 x x x 的相关样式表(将相关数据同时作为 x 轴和 y 轴),但我想要 fuzzywuzzy 库的函
机器学习与传统编程的一个重要区别在于机器学习比传统编程涉及了更多的数学知识。不过,随着机器学习的飞速发展,各种框架应运而生,在数据分析等应用中使用机器学习时,使用现成的库和框架成为常态,似乎越来越不需
当我在 julia 中输入这个错误跳转但我不知道为什么,它应该工作。/ julia> A = [1 2 3 4; 5 6 7 8; 1 2 3 4; 5 6 7 8] 4×4 Array{Int64,
我是一名优秀的程序员,十分优秀!