c++ - 为什么 std::inner_product 比原始实现慢？-6ren

c++ - 为什么 std::inner_product 比原始实现慢？

转载作者：太空狗更新时间：2023-10-29 20:02:17

27

4

这是我天真的点积实现:

float simple_dot(int N, float *A, float *B) {
    float dot = 0;
    for(int i = 0; i < N; ++i) {
    dot += A[i] * B[i];
    }

    return dot;
}

这是使用 C++ 库:

float library_dot(int N, float *A, float *B) {
    return std::inner_product(A, A+N, B, 0);
}

我运行了一些基准测试(代码在这里 https://github.com/ijklr/sse )，库版本慢了很多。我的编译器标志是 -Ofast -march=native

最佳答案

你的两个函数不做同样的事情。该算法使用一个累加器，其类型是从初始值推导，在您的情况下 (0) 是 int。将 float 累加到 int 不仅比累加到 float 花费的时间更长，而且会产生不同的结果。

原始循环代码的等价物是使用初始值 0.0f，或等价于 float{}。

(请注意，std::accumulate 在这方面非常相似。)

关于c++ - 为什么 std::inner_product 比原始实现慢？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43079506/

27

4

0

文章推荐： c++ - 无方法抽象类？

文章推荐： c# - PdfSharp - 在 Acrobat 中打开文档时错误的 PDF 页面设置

文章推荐： C++数组指针

c++ - 内联 std::inner_product
据称内联 std::inner_product() 不会内联 gcc 编译器 inline T inner_product(T1 first1, T1 last1, T2 first2, T ini
c++ - 在我自己的类上使用 std::inner_product
我想出了我自己的小类，叫做 TinyVector。现在我正在尝试在其上使用 std::inner_product。但我无法让它工作，我不明白为什么这不起作用。我正在使用 Visual Studio 2
c++ - inner_product 和复 vector
看来我在这里做的事情非常错误。你能帮助我吗？目的是将 inner_product 用于复杂 vector 。 #include #include #include #include using n
c++ - 通过引用 std::inner_product 传递迭代器
考虑以下场景: std::vector a {1, 2, 3}; std::vector b {1, 2, 3, 4}; auto it = b.begin(); auto res = std::in
c++ - 数字滤波器和 std::inner_product 优化
在数字滤波 C++ 应用程序中，我使用 std::inner_product (使用 std::vector 和 std::deque )为每个数据样本计算滤波器系数和输入数据之间的点积。在分析我的应
c++ - 替代 std::inner_product 算法？
我知道如果您处理两个不同大小的数组，std::inner_product 算法会出现问题。是否有另一种标准库算法可以处理不同大小的数组，例如通过自动使用两个数组大小中较小的一个？最佳答案实现起来并
c++ - 为什么 std::inner_product 比原始实现慢？
这是我天真的点积实现: float simple_dot(int N, float *A, float *B) { float dot = 0; for(int i = 0; i <
c++ - 使用 std::inner_product 时内积为零
下面的 C++ 程序应该返回一个严格的正值。但是，它返回 0。会发生什么？我怀疑是 int-double 转换，但我不知道为什么以及如何。 #include #include #include
c++ - std::inner_product 计算 vector 的标准差
我正在尝试创建一个函数来计算标准偏差。我尝试使用 std::inner_product和用于内部产品 op1 和 op2 的 lambda 表达式来修改 std::inner_product 的操作
c++ - 将 binary_function 传递给另一个函数内的 inner_product 时出现编译器错误
以下代码: $ cat test02.cpp #include #include #include #include #include struct myadd : public s
c++ - 带有 omp 的 std::inner_product
是否可以将 C++ 中的 std::inner_product() 与 omp.h 库并行化？不幸的是，我不能使用在较新版本的 gcc 中可用的 __gnu_parallel::inner_produ
c++ - 制作对 inner_product 的自定义调用 (C++ STL)
我无法理解如何使用 inner_product结合 std::vector和一个 std::vector> .给定，例如和 ,> , 我想要 inner_product生产 2* + 3* = +
c++ - 如何链接 C++ `transform` 和 `inner_product` 调用？
我想做这样的事情: vector v; v.push_back(0); v.push_back(1); v .transform([](auto i) { return i + 2; })
c++ - G++/MSVC++2008 在矩阵实现中调用 inner_product() 的区别
我想为一个奇怪的问题寻求帮助。对于从网上获得的关于矩阵的代码，我可以在 g++ 上编译和运行，但无法在 VC++ 2008 上构建。vc++ 的构建错误是 ------ Build started:
c++ - std::inner_product 比手动快 4 倍但未使用 SIMD？
我对 std::inner_product() 与手动点积计算相比如何执行很感兴趣，所以我做了一个测试。 std::inner_product() 比手动实现快 4 倍。我觉得这很奇怪，因为没有那么多
c++ - 性能差异:std::accumulate vs std::inner_product vs Loop
今天，我想分享一些在尝试实现这个简单操作时让我大吃一惊的事情: 我发现了执行相同操作的不同方法: 通过使用 std::inner_product。实现谓词并使用 std::accumulate 函数

首页

博学

6Ren·AI

商城

c++ - 为什么 std::inner_product 比原始实现慢？