gpt4 book ai didi

c++ - 为什么 Eigens mean() 方法比 sum() 方法快得多?

转载 作者:可可西里 更新时间:2023-11-01 15:22:23 24 4
gpt4 key购买 nike

这是一个相当理论性的问题,但我对此很感兴趣,如果有人对此有一些专业知识并愿意分享,我会很高兴。

我有一个包含 2000 行和 600 列的 float 矩阵,我想从每一行中减去列的平均值。我测试了以下两行并比较了它们的运行时间:

MatrixXf centered = data.rowwise() - (data.colwise().sum() / data.cols());
MatrixXf centered = data.rowwise() - data.colwise().mean();

我想,mean()将每列的总和除以行数并没有什么不同,但是第一行的执行在我的计算机上需要 12.3 秒,而第二行在 0.09 秒内完成。

我正在使用 Eigen version 3.2.6 ,目前是最新版本,我的矩阵以行优先顺序存储。

有人知道 Eigen 的内部结构吗?这可以解释这种巨大的性能差异吗?


编辑:我应该添加 data在上面的代码中实际上是 Eigen::Map< Eigen::MatrixXf<Eigen::Dynamic, Eigen::Dynamic, Eigen::RowMajor> > 类型并将 Eigen 的功能映射到原始缓冲区。


编辑 2:按照 GuyGreer 的建议,我将提供一些示例代码来重现我的发现:

#include <iostream>
#include <chrono>
#include <Eigen/Core>
using namespace std;
using namespace std::chrono;
using namespace Eigen;

int main(int argc, char * argv[])
{
MatrixXf data(10000, 1000), centered;
data.setRandom();
auto start = high_resolution_clock::now();
if (argc > 1)
centered = data.rowwise() - data.colwise().mean();
else
centered = data.rowwise() - (data.colwise().sum() / data.rows());
auto stop = high_resolution_clock::now();
cout << duration_cast<milliseconds>(stop - start).count() << " ms" << endl;
return 0;
}

编译:

g++ -O3 -std=c++11 -o test test.cc

不带参数运行生成的程序,因此使用 sum() , 在我的机器上运行 test 1 需要 126 秒使用 mean()只需0.03秒!


编辑 3:结果(见评论),它不是 sum()这需要很长时间,但结果 vector 除以行数。所以新的问题是:为什么 Eigen 需要超过 2 分钟才能将具有 1000 列的 vector 除以单个标量?

最佳答案

不知何故,每次都重新计算部分归约(求和)和除法,因为 operator/ 错误地丢失了一些关于部分归约评估成本的关键信息...显式评估均值修复问题:

centered = data.rowwise() - (data.colwise().sum() / data.cols()).eval();

当然,这个评估应该由 Eigen 为您完成,由变更集固定 42ab43a .此修复将成为下一个 3.2.7 和 3.3 版本的一部分。

关于c++ - 为什么 Eigens mean() 方法比 sum() 方法快得多?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33377266/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com