gpt4 book ai didi

c++ - 加速简单 Eigen 程序的基本方法

转载 作者:行者123 更新时间:2023-11-30 03:16:10 29 4
gpt4 key购买 nike

我正在寻找使用 Eigen 进行简单操作的最快方法。可用的数据结构太多了,很难说哪个是最快的。

我尝试过预定义我的数据结构,但即便如此,我的代码仍被类似的 Fortran 代码超越。我猜 Eigen::Vector3d 是满足我需要的最快的(因为它是预定义的),但我很容易错。在编译时使用 -O3 优化给了我很大的提升,但我的运行速度仍然比相同代码的 Fortran 实现慢 4 倍。

我使用“原子”结构,然后将其存储在由以下定义的“原子” vector 中:

struct Atom {
std::string element;
//double x, y, z;
Eigen::Vector3d coordinate;
};
std::vector<Atom> atoms;

我的代码中最慢的部分如下:

distance = atoms[i].coordinate - atoms[j].coordinate;
distance_norm = distance.norm();

我可以使用更快的数据结构吗?或者有没有更快的方法来执行这些基本操作?

最佳答案

正如您在评论中指出的那样,添加 -fno-math-errno 编译器标志可以大大提高速度。至于为什么会发生这种情况,您的代码片段显示您正在通过 distance_norm = distance.norm(); 执行 sqrt

这使得编译器不会在每个 sqrt 之后设置 ERRNO(这是对线程局部变量的保存写入),这更快并且 启用对重复执行此操作的任何循环的矢量化。唯一的缺点是失去了 IEEE 遵守。参见 gcc man .

您可能想尝试的另一件事是添加 -march=native 并在 -march=native 未打开时添加 -mfma为你打开它(我似乎记得在某些情况下它没有被 native 打开并且必须手动打开 - check here for details )。与 Eigen 一样,您可以使用 -DNDEBUG 禁用边界检查。

SoA 而不是 AoS!!!如果性能确实是一个真正的问题,请考虑使用单个 4xN 矩阵来存储位置(并让 Atom 保留列索引而不是 Eigen::Vector3d)。在您显示的小代码片段中应该没有太大关系,但根据您的其余代码,可能会给您带来另一个巨大的性能提升。

关于c++ - 加速简单 Eigen 程序的基本方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56547557/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com