gpt4 book ai didi

c++ 3D matrix using vector 性能不佳

转载 作者:行者123 更新时间:2023-11-28 00:17:00 25 4
gpt4 key购买 nike

你好,我正在尝试将此 matlab 代码转换为 C++。顺便说一句,也可以使用 openCV。

 imageData = toolbox.bayer.ColorOrder.cat( imageData, 0, 3);

这是之前的图片数据

1   2   3   4   5   6   7   8   9   10
11 12 13 14 15 16 17 18 19 20
21 22 23 24 25 26 27 28 29 30
31 32 33 34 35 36 37 38 39 40

这是之后的图像数据:

val(:,:,1) =

 1     3     5     7     9
21 23 25 27 29

val(:,:,2) =

 2     4     6     8    10
22 24 26 28 30

val(:,:,3) =

11    13    15    17    19
31 33 35 37 39

val(:,:,4) =

12    14    16    18    20
32 34 36 38 40

这是我的 C++ 代码,我正在获取 int** 无法更改它...

vector<vector<vector<double> > > Utilities::MatrixConcat(int **raw_frame, int _width, int _height)
{
vector<vector<vector<double> > > imageData;
imageData.resize(_height/2);
for (int i = 0; i < _height/2; ++i)
{
imageData[i].resize(_width/2);

for (int j = 0; j < _width/2; ++j)
{
imageData[i][j].resize(4);
}
}
//[x][y][0]
for (int h = 0; h < _height/2; h++)
{
for (int w = 0; w < _width/2; w++)
{
imageData[h][w][0] = raw_frame[2*h][2*w];
}
}
//[x][y][1]
for (int h = 0; h < _height/2; h++)
{
for (int w = 0; w < _width/2; w++)
{
imageData[h][w][1] = raw_frame[2*h][2*w+1];
}
}

for (int h = 0; h < _height/2; h++)
{
for (int w = 0; w < _width/2; w++)
{
imageData[h][w][2] = raw_frame[2*h+1][2*w];
}
}

for (int h = 0; h < _height/2; h++)
{
for (int w = 0; w < _width/2; w++)
{
imageData[h][w][3] = raw_frame[2*h+1][2*w+1];
}
}
return imageData;
}

我的问题是我的矩阵(不是用于测试的矩阵)是 4000X3000,这意味着此函数花费的时间太长。您能解释一下为什么要花这么长时间吗?我该如何优化它?

我也可以使用 openCV 将此 2D 矩阵转换为 3D 矩阵。

更新:

这是我为获得相同结果而构建的测试

int** gili = new int*[4];
for (int i = 0; i < 4; i++)
{
gili[i] = new int[10];
}

for (int i = 0,k=1; i < 4; i++)
{
for (int j = 0; j < 10; j++)
{
gili[i][j] = k;
k++;
}
}
vector<vector<vector<double> > > imageData = Utilities::MatrixConcat(gili,10,4);

最佳答案

您的代码存在两个问题,数据结构和访问顺序。

数据结构
vector 的 vector 可能不是最有效的数据结构,因为通过索引运算符的每次访问都涉及某种程度的指针追踪。这可以通过使用迭代器(在可能的情况下)或围绕单个 vector/数组构建包装器来稍微缓解,该包装器允许您将三维位置转换为该容器的索引。

一个简单的 3D 矩阵实现可能如下所示:

class Matrix3D{
private:
size_t sizeX, sizeY, sizeZ;
std::vector<double> data;
size_t getIdx(size_t x, size_t y, size_t z) const {
return x + sizeX*y + sizeX*sizeY*z;
}

public:
Matrix3D(size_t X, size_t Y, size_t Z) :sizeX(X), sizeY(Y), sizeZ(Z),data(X*Y*Z){}
double& operator()(size_t x, size_t y, size_t z){ return data[getIdx(x, y, z)]; }
double operator() (size_t x, size_t y, size_t z) const{ return data[getIdx(x, y, z)]; }

//arithmetic operators
};

或者如果维度是一个编译时间常量:

    template<size_t sizeX, size_t sizeY, size_t sizeZ>
class Matrix3D_ConstDim{
private:
std::unique_ptr<std::array<double,sizeX*sizeY*sizeZ>> data;
size_t getIdx(size_t x, size_t y, size_t z) const {
return x + sizeX*y + sizeX*sizeY*z;
}
public:
Matrix3D_ConstDim(){
data = std::make_unique<std::array<double, sizeX*sizeY*sizeZ>>();
}
double& operator()(size_t x, size_t y, size_t z){ return (*data)[getIdx(x, y, z)]; }
double operator() (size_t x, size_t y, size_t z) const{ return (*data)[getIdx(x, y, z)]; }
//arithmetic operators
};

用法:

int main() {
Matrix3D m1(10, 5, 4);
m1(1, 2, 3) = 4.5;
std::cout << m1(1, 2, 3) << std::endl;

Matrix3D_ConstDim<10, 5, 4> m2;
m2(1, 2, 3) = 4.5;
std::cout << m2(1, 2, 3) << std::endl;
}

元素访问
第二个(可能更重要的)事情是顺序访问。如果要遍历矩阵中的所有元素,请确保访问元素的顺序与它们在内存中的排列顺序相同。结果,几乎所有访问都会导致缓存命中(即使访问缓存行中的第一个元素时,您也会 - 由于预取 - 很有可能会命中 l1 缓存。它还可能允许您的编译器执行代码的自动vertorization。这意味着编译器将使用特殊指令,同时执行循环的多次迭代。
例如,如果你想初始化上面的矩阵,代码可能如下所示:

    for (size_t z = 0; z < 4; ++z){
for (size_t y = 0; y < 4; ++y){
for (size_t x = 0; x < 4; ++x){ //<-- inner most loop changes X
m1(x, y, z) = x*(y + 1)*(z + 2); //<-- arbitrary values
}
}
}

关于c++ 3D matrix using vector 性能不佳,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29571074/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com