- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在尝试通过 pdpotrf() 进行 Cholesky 分解MKL-Intel 的库,它使用 ScaLAPACK。我正在读取主节点中的整个矩阵,然后像在这个 example 中一样分发它.当 SPD 矩阵的维度是偶数时,一切正常。但是,当它是奇数时,pdpotrf()
认为矩阵不是正定的。
会不会是因为子矩阵不是SPD?我正在使用这个矩阵:
子矩阵是(有 4 个进程和大小为 2x2 的 block ):
A_loc on node 0
4 1 2
1 0.5 0
2 0 16
nrows = 3, ncols = 2
A_loc on node 1
2 0.5
0 0
0 0
nrows = 2, ncols = 3
A_loc on node 2
2 0 0
0.5 0 0
nrows = 2, ncols = 2
A_loc on node 3
3 0
0 0.625
这里,每个子矩阵都不是 SPD,但是,整个矩阵是 SPD(已检查运行 1 个进程)。我应该怎么办?或者我无能为力并且 pdpotrf()
不适用于奇数大小的矩阵?
下面是我调用例程的方式:
int iZERO = 0;
int descA[9];
// N, M dimensions of matrix. lda = N
// Nb, Mb dimensions of block
descinit_(descA, &N, &M, &Nb, &Mb, &iZERO, &iZERO, &ctxt, &lda, &info);
...
pdpotrf((char*)"L", &ord, A_loc, &IA, &JA, descA, &info);
我也试过这个:
// nrows/ncols is the number of rows/columns a submatrix has
descinit_(descA, &N, &M, &nrows, &ncols, &iZERO, &iZERO, &ctxt, &lda, &info);
但是我得到一个错误:
{ 0, 0}: On entry to { 0, 1}: On entry to PDPOTR{ 1, 0}: On entry to PDPOTRF parameter number 605 had an illegal value { 1, 1}: On entry to PDPOTRF parameter number 605 had an illegal value F parameter number 605 had an illegal value
PDPOTRF parameter number 605 had an illegal value info < 0: If the i-th argument is an array and the j-entry had an illegal value, then INFO = -(i*100+j), if the i-th argument is a scalar and had an illegal value, then INFO = -i. info = -605
来 self 的 answer , 你可以看到函数的参数是什么意思。
代码是基于这个question .输出:
gsamaras@pythagoras:~/konstantis/check_examples$ ../../mpich-install/bin/mpic++ -o test minor.cpp -I../../intel/mkl/include ../../intel/mkl/lib/intel64/libmkl_scalapack_lp64.a -Wl,--start-group ../../intel/mkl/lib/intel64/libmkl_intel_lp64.a ../../intel/mkl/lib/intel64/libmkl_core.a ../../intel/mkl/lib/intel64/libmkl_sequential.a -Wl,--end-group ../../intel/mkl/lib/intel64/libmkl_blacs_intelmpi_lp64.a -lpthread -lm -ldl
gsamaras@pythagoras:~/konstantis/check_examples$ mpiexec -n 4 ./test
Processes grid pattern:
0 1
2 3
nrows = 3, ncols = 3
A_loc on node 0
4 1 2
1 0.5 0
2 0 16
nrows = 3, ncols = 2
A_loc on node 1
2 0.5
0 0
0 0
nrows = 2, ncols = 3
A_loc on node 2
2 0 0
0.5 0 0
nrows = 2, ncols = 2
A_loc on node 3
3 0
0 0.625
Description init sucesss!
matrix is not positive definte
Matrix A result:
2 1 2 0.5 2
0.5 0.5 0 0 0
1 0 1 0 -0.25
0.25 -1 -0.5 0.625 0
1 -1 -2 -0.5 14
最佳答案
问题可能来自:
MPI_Bcast(&lda, 1, MPI_INT, 0, MPI_COMM_WORLD);
在这行之前,如果矩阵的维数是奇数,则lda
在每个进程中都是不同的。两个进程处理 2 行,两个进程处理 3 行。但在 MPI_Bcast()
之后,lda
处处相同 (3)。
问题是子程序的参数lda
DESCINIT
必须是本地数组的前导维度,即 2 或 3。
通过评论 MPI_Bcast()
,我得到:
Description init sucesss!
SUCCESS
Matrix A result:
2 1 2 0.5 2
0.5 0.5 0 0 0
1 -1 1 0 0
0.25 -0.25 -0.5 0.5 0
1 -1 -2 -3 1
最后,它会解释该程序在偶数维度上运行良好而在奇数维度上失败!
关于c++ - Cholesky 与 ScaLAPACK,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31231428/
我正在开发一种算法,可以求解 Ax= b,其中 A 和 b 已知。 有两种方法可以实现此目的:x= A-1 b 或使用 Cholesky。我知道矩阵始终是方正定矩阵,尽管 det(A) 可能为零。在极
我真的很想评估你们中是否有任何人可以指出我在 Cholesky 分解 方面最优化和计算速度最快的线性代数库。 到目前为止,我一直在使用 Apache Commons Math 库,但也许已经有更强大和
我对 c 相当陌生,想根据维基百科的伪代码实现 cholesky 分解。需要动态分配内存。 我用以下示例矩阵尝试了我的代码: 4.000 2.000 0.000 0.000 2.000 5
double *cholesky(double *A, int n) { double *L = (double*)calloc(n * n, sizeof(double)); if
我想知道是否可以在不需要临时数组的情况下通过 Cholesky 分解获得矩阵的逆。截至目前,我可以在不使用临时数组的情况下进行 cholesky 分解,但从那里我还没有想出一种方法来获得原始矩阵的逆矩
我正尝试在 C++ 中实现 Cholesky 分解,它以前在 lapack dpotrf_ 中实现过. Cholesky 分解:R' * R = A 代码: #include #include l
我正在使用 python 的 scikits.sparse.cholmod 来获取对称矩阵的 cholesky 分解。 我将 cholesky() 的结果与 matlab 的 chol() 进行了比较
我正在开发一些代码,可以从 HW 获取浮点或定点数据。目前我们将其作为 float 。 底层API都是定点的。所以我们必须将数据作为定点传回。我们使用的算法是 Cholesky。我想知道为什么我们必须
我使用 OpenCL 实现了以下 Cholesky 分解算法。该代码表现出随机行为。它仅在某些时候匹配 cpu 输出。有人可以帮我弄清楚我的实现有什么问题吗。 算法如下: procedure CHOL
我对大型稀疏矩阵的 Cholesky 分解很感兴趣。我遇到的问题是 Cholesky 因子不一定是稀疏的(就像两个稀疏矩阵的乘积不一定是稀疏的一样)。 例如,对于仅沿第一行、第一列和对角线具有非零值的
我正在尝试通过 pdpotrf() 进行 Cholesky 分解MKL-Intel 的库,它使用 ScaLAPACK。我正在读取主节点中的整个矩阵,然后像在这个 example 中一样分发它.当 SP
Cholesky Decomposition 有两种不同的形式: A = M * ctranspose (M) 和 LDL 形式 A = L * D * ctranspose (L) 其中 ctran
我想用 Sympy 找到一个符号 Cholesky 分解。矩阵 M(参见示例)是实对称的(因此是埃尔米特矩阵)。但 Sympy 引发 ValueError:矩阵必须是厄米特矩阵。 两个问题: 为什么会
我想使用 Eigen 来计算稀疏矩阵的 cholesky 分解。但是,结果不正确,我找不到原因。我如何获得正确答案? Eigen 中是否实现了特殊例程,利用稀疏矩阵的结构来提高性能(例如,对于下例中的
OpenCV 中是否有任何函数可用于对矩阵应用 Cholesky 分解? 最佳答案 如果仍然相关,OCV 3.0.0 直接通过 HAL 接口(interface)支持 Cholesky。参见 cv::
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 关闭 9 年前。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow
我想获得 tf.cholesky 相对于其输入的梯度。目前,tf.cholesky 没有注册梯度: LookupError: No gradient defined for operation 'Ch
我想知道是否有人可以帮助我调试以下应该计算正定矩阵的上三角 cholesky 分解的 OCaml 代码。 我知道它不是很实用而且很笨重,所以我提前道歉。我在下面给出了一些原因。 不管怎样,这就过去了!
我正在尝试在 Halide 中实现 Cholesky 分解。部分常见算法(例如 crout)由对三角矩阵的迭代组成。在某种程度上,分解的对角线元素是通过从输入矩阵的对角线元素中减去部分列和来计算的。列
谁能给我指出一个库/代码,让我可以在 python (numpy) 中对 Cholesky 分解执行低阶更新?Matlab 将此功能作为称为“cholupdate”的函数提供。LINPACK 也有这个
我是一名优秀的程序员,十分优秀!