- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
这是我天真的点积实现:
float simple_dot(int N, float *A, float *B) {
float dot = 0;
for(int i = 0; i < N; ++i) {
dot += A[i] * B[i];
}
return dot;
}
这是使用 C++ 库:
float library_dot(int N, float *A, float *B) {
return std::inner_product(A, A+N, B, 0);
}
我运行了一些基准测试(代码在这里 https://github.com/ijklr/sse ),库版本慢了很多。我的编译器标志是 -Ofast -march=native
最佳答案
你的两个函数不做同样的事情。该算法使用一个累加器,其类型是从初始值推导,在您的情况下 (0
) 是 int
。将 float 累加到 int 不仅比累加到 float 花费的时间更长,而且会产生不同的结果。
原始循环代码的等价物是使用初始值 0.0f
,或等价于 float{}
。
(请注意,std::accumulate
在这方面非常相似。)
关于c++ - 为什么 std::inner_product 比原始实现慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43079506/
据称内联 std::inner_product() 不会内联 gcc 编译器 inline T inner_product(T1 first1, T1 last1, T2 first2, T ini
我想出了我自己的小类,叫做 TinyVector。现在我正在尝试在其上使用 std::inner_product。但我无法让它工作,我不明白为什么这不起作用。我正在使用 Visual Studio 2
看来我在这里做的事情非常错误。你能帮助我吗?目的是将 inner_product 用于复杂 vector 。 #include #include #include #include using n
考虑以下场景: std::vector a {1, 2, 3}; std::vector b {1, 2, 3, 4}; auto it = b.begin(); auto res = std::in
在数字滤波 C++ 应用程序中,我使用 std::inner_product (使用 std::vector 和 std::deque )为每个数据样本计算滤波器系数和输入数据之间的点积。在分析我的应
我知道如果您处理两个不同大小的数组,std::inner_product 算法会出现问题。是否有另一种标准库算法可以处理不同大小的数组,例如通过自动使用两个数组大小中较小的一个? 最佳答案 实现起来并
这是我天真的点积实现: float simple_dot(int N, float *A, float *B) { float dot = 0; for(int i = 0; i <
下面的 C++ 程序应该返回一个严格的正值。但是,它返回 0。 会发生什么?我怀疑是 int-double 转换,但我不知道为什么以及如何。 #include #include #include
我正在尝试创建一个函数来计算标准偏差。 我尝试使用 std::inner_product和用于内部产品 op1 和 op2 的 lambda 表达式来修改 std::inner_product 的操作
以下代码: $ cat test02.cpp #include #include #include #include #include struct myadd : public s
是否可以将 C++ 中的 std::inner_product() 与 omp.h 库并行化?不幸的是,我不能使用在较新版本的 gcc 中可用的 __gnu_parallel::inner_produ
我无法理解如何使用 inner_product结合 std::vector和一个 std::vector> .给定,例如 和 ,> , 我想要 inner_product生产 2* + 3* = +
我想做这样的事情: vector v; v.push_back(0); v.push_back(1); v .transform([](auto i) { return i + 2; })
我想为一个奇怪的问题寻求帮助。对于从网上获得的关于矩阵的代码,我可以在 g++ 上编译和运行,但无法在 VC++ 2008 上构建。vc++ 的构建错误是 ------ Build started:
我对 std::inner_product() 与手动点积计算相比如何执行很感兴趣,所以我做了一个测试。 std::inner_product() 比手动实现快 4 倍。我觉得这很奇怪,因为没有那么多
今天,我想分享一些在尝试实现这个简单操作时让我大吃一惊的事情: 我发现了执行相同操作的不同方法: 通过使用 std::inner_product。 实现谓词并使用 std::accumulate 函数
我是一名优秀的程序员,十分优秀!