gpt4 book ai didi

c++ - 稀疏矩阵的填充速度非常慢,Eigen 中没有内存增益

转载 作者:行者123 更新时间:2023-11-28 06:01:03 29 4
gpt4 key购买 nike

我正在尝试实现Eigen tutorial 中给出的示例作为伪代码。据我所知,它说明了填充稀疏矩阵的推荐方法,前提是每列的非零条目数已知。

伪代码在标题“Filling a sparse Matrix”下找到,写成如下:

1: SparseMatrix<double> mat(rows,cols);         // default is column major
2: mat.reserve(VectorXi::Constant(cols,6));
3: for each i,j such that v_ij != 0
4: mat.insert(i,j) = v_ij; // alternative: mat.coeffRef(i,j) += v_ij;
5: mat.makeCompressed(); // optional

我尝试将其转换为 C 的尝试如下所示。我已经(希望)这样写 vee() ,它会在每列中创建 2500 个非零元素。因此 2500 应对应示例中的 6。我将其设置为 3000 以测试 make.Compressed。

不幸的是,我不了解该程序的行为。它在几秒钟内执行 i=0...3000,然后卡住了几分钟。然后它达到 6000 并再次卡住几分钟。为什么会这样以及如何获得更好的性能?

此外,内存占用也很奇怪。您可以看到,有时在接近尾声时,Eigen 使用的内存明显多于 GSL 中相应的密集矩阵所需的内存。使用的内存也波动很大。步长大于 100MB

我这样编译运行:

ludi@ludi-M17xR4:~/Desktop/tests$ g++ -o eigenfill.x eigenfill.cc -L/usr/local/lib -lgsl -lgslcblas && ./eigenfill.x

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <Eigen/Sparse>
#include <gsl/gsl_matrix.h>
#define rows 1e4
#define cols 1e4



/*-- DECLARATIONES --*/
int FillMatrix(Eigen::SparseMatrix<double> mat);
double vee(int i, int j);

int main()
{
printf("---> Watch gsl matrix memory usage!\n");
gsl_matrix *testmat = gsl_matrix_calloc(rows, cols);
sleep(20);
gsl_matrix_free(testmat);
printf("---> Watch eigen matrix memory usage!\n");

Eigen::SparseMatrix<double> mat(rows,cols); // default is column major
FillMatrix(mat);
printf("------------------------DONE");
return(0);
}

/*-- --*/
int FillMatrix(Eigen::SparseMatrix<double> mat)
{
int i, j;
Eigen::VectorXd Vres;
mat.reserve(Eigen::VectorXi::Constant(cols,3000));
for(i=0;i<rows;i++)
{
if(i%500==0){printf("i= %i\n", i);}
for(j=0;j<cols;j++)
{
if (vee(i,j) != 0){mat.insert(i,j) = vee(i,j); /*alternative: mat.coeffRef(i,j) += v_ij;*/ }
}

}
printf("--->starting compression");
mat.makeCompressed();

return(0);
}
/*-- --*/
double vee(int i, int j)
{
double result = 0.0;

if(j%4 == 0){result =1.0;}

return result;
}
/*-- --*/

编辑

有一个回答提醒我需要用到地址,因为FillMatrix()的局部变量跑完就没有了。我尝试了以下,但无法编译:

#include <iostream>
#include <stdio.h>
#include <stdlib.h>
#include <Eigen/Sparse>
#include <gsl/gsl_matrix.h>
#define rows 1e4
#define cols 1e4



/*-- DECLARATIONES --*/
int FillMatrix(Eigen::SparseMatrix<double> & mat);
double vee(int i, int j);

int main()
{
printf("---> Watch gsl matrix memory usage!\n");
gsl_matrix *testmat = gsl_matrix_calloc(rows, cols);
sleep(20);
gsl_matrix_free(testmat);
printf("---> Watch eigen matrix memory usage!\n");

Eigen::SparseMatrix<double> mat(rows,cols); // default is column major
FillMatrix(& mat);
printf("------------------------>DONE\n");
return(0);
}

/*-- --*/
int FillMatrix(Eigen::SparseMatrix<double> &mat)
{
int i, j;
Eigen::VectorXd Vres;
mat.reserve(Eigen::VectorXi::Constant(cols,3000));
for(i=0;i<rows;i++)
{
if(i%500==0){printf("i= %i\n", i);}
for(j=0;j<cols;j++)
{
if (vee(i,j) != 0){mat.insert(i,j) = vee(i,j); /*alternative: mat.coeffRef(i,j) += v_ij;*/ }
}

}
printf("--->starting compression\n");
mat.makeCompressed();

return(0);
}
/*-- --*/
double vee(int i, int j)
{
double result = 0.0;

if(i%4 == 0){result =1.0;}

return result;
}
/*-- --*/

错误信息是:

ludi@ludi-M17xR4:~/Desktop/tests$ g++ -o eigenfill.x eigenfill.cc -L/usr/local/lib -lgsl -lgslcblas && ./eigenfill.x
eigenfill.cc: In function ‘int main()’:
eigenfill.cc:24:17: error: invalid initialization of non-const reference of type ‘Eigen::SparseMatrix<double>&’ from an rvalue of type ‘Eigen::SparseMatrix<double>*’
FillMatrix(& mat);
^
eigenfill.cc:12:5: error: in passing argument 1 of ‘int FillMatrix(Eigen::SparseMatrix<double>&)’
int FillMatrix(Eigen::SparseMatrix<double> & mat);
^
ludi@ludi-M17xR

编辑如果我写它编译:

FillMatrix(mat);

代替

FillMatrix(&mat);

我不明白。最后一个不应该是正确的吗?

最佳答案

这是因为您完全填满了四栏中的一栏。它看起来像下面这样:

1 0 0 0 1 0 0 0 1 ...
1 0 0 0 1 0 0 0 1 ...
1 0 0 0 1 0 0 0 1 ...
1 0 0 0 1 0 0 0 1 ...
...

j%4 == 0 替换为 i%4 == 0 即可。内存使用量正好是:2500*cols*(sizeof(double)+sizeof(int)) + cols*sizeof(int)

您还必须修复 FillMatrix 的原型(prototype),以便填充真实矩阵而不是临时矩阵:

int FillMatrix(Eigen::SparseMatrix<double> &mat);

最后,如果您的目标确实是使用具有大约 1/4 非零值的稀疏矩阵,那么密集表示可能会更快。

关于c++ - 稀疏矩阵的填充速度非常慢,Eigen 中没有内存增益,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33286299/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com