gpt4 book ai didi

c++ - 为什么自制的二进制搜索算法比 std::binary_search 慢?

转载 作者:塔克拉玛干 更新时间:2023-11-02 23:34:38 24 4
gpt4 key购买 nike

std::binary_search 击败了一个简单的自制二进制搜索算法(再次):

// gcc version 4.8.2 X86_64

#ifndef EXAMPLE_COMPARE_VERSION
# define EXAMPLE_COMPARE_VERSION 0
#endif

static const long long LOOPS = 0x1fffffff;

#include <cassert>
#include <cstdlib>
#include <ctime>
#include <cstdio>

#if EXAMPLE_COMPARE_VERSION
#include <algorithm>

inline bool stl_compare(const int l, const int r) {
return l < r;
}

#else

inline bool compare(const int *beg, const int *end, int v) {
for (const int *p; beg <= end;) {
p = beg + (end - beg) / 2;
if (*p < v) beg = p + 1;
else if (*p > v) end = p - 1;
else return true;
}
return false;
}
#endif

int main() {
const int arr[] = {
1784, 1785, 1787, 1789, 1794, 1796, 1797, 1801,
1802, 1805, 1808, 1809, 1912, 1916, 1918, 1919,
1920, 1924, 1925, 1926, 1929, 1930, 2040, 2044,
2047, 2055, 2057, 2058, 2060, 2061, 2064, 2168,
2172, 2189, 2193, 2300, 2307, 2309, 2310, 2314,
2315, 2316, 2424, 2429, 2432, 2433, 2438, 2441,
2448, 2552, 2555, 2563, 2565, 2572, 2573, 2680,
2684, 2688, 2694, 2697, 2699, 2700, 2704, 2705,
2808, 2811, 2813, 2814, 2816, 2818, 2822, 2826,
2827, 2828, 2936, 2957, 3064, 3070, 3072, 3073,
3074, 3075, 3076, 3077, 3078, 3081, 3082, 3084,
3085, 3086, 3088, 3192, 3196, 3198, 3200, 3205,
3206, 3211, 3212, 3213, 3326, 3327, 3328, 3330,
3331, 3333, 3337, 3338, 3339, 3344, 3448, 3449,
3451, 3452, 3454, 3459, 3461, 3462, 3465, 3469,
3472, 3578, 3585, 3588, 3593, 3594, 3704, 3712,
3715, 3722, 3723, 3852, 3972, 3973, 3974, 3980,
3982, 4088, 4090, 4091, 4092, 4094, 4096, 4098,
4099, 4100, 4101, 4102, 4103, 4105, 4106, 4107,
4108, 4109, 4110, 4216, 4220, 4222, 4223, 4224,
4226, 4227, 4229, 4230, 4233, 4234, 4235, 4238,
4240, 4350, 4354, 4361, 4369, 4476, 4480, 4486,
4600, 4614, 4735, 4864, 4870, 4984, 4991, 5004,
};
clock_t t = clock();
const size_t len = sizeof(arr) / sizeof(arr[0]);
for (long long i = 0; i < LOOPS; i++) {
int v = arr[rand() % len];
#if EXAMPLE_COMPARE_VERSION >= 2
assert(std::binary_search(arr, arr + len, v, stl_compare));
#elif EXAMPLE_COMPARE_VERSION
assert(std::binary_search(arr, arr + len, v));
#else
assert(compare(arr, arr + len, v));
#endif
}
printf("compare version: %d\ttime: %zu\n",
EXAMPLE_COMPARE_VERSION, (clock() - t) / 10000);
}

编译文件(如果保存为t.cc)

g++ t.cc -O3 -DEXAMPLE_COMPARE_VERSION=0 -o t0
g++ t.cc -O3 -DEXAMPLE_COMPARE_VERSION=1 -o t1
g++ t.cc -O3 -DEXAMPLE_COMPARE_VERSION=2 -o t2

测试

./t2 ; ./t0 ; ./t1

在我的机器上输出(时间越短越快):

compare version: 2      time: 3533
compare version: 0 time: 4074
compare version: 1 time: 3968

当将 EXAMPLE_COMPARE_VERSION 设置为 0 时,我们使用自制的二进制搜索算法。

inline bool compare(const int *beg, const int *end, int v) {
for (const int *p; beg <= end;) {
p = beg + (end - beg) / 2;
if (*p < v) beg = p + 1;
else if (*p > v) end = p - 1;
else return true;
}
return false;
}

当将 EXAMPLE_COMPARE_VERSION 设置为 1 时,我们使用:

template <class ForwardIterator, class T>
bool binary_search (ForwardIterator first, ForwardIterator last,
const T& val);

当将 EXAMPLE_COMPARE_VERSION 设置为 2 时,我们使用:

template <class ForwardIterator, class T, class Compare>
bool binary_search (ForwardIterator first, ForwardIterator last,
const T& val, Compare comp);

// the Compare function:
inline bool stl_compare(const int l, const int r) {
return l < r;
}

这两个std::binary_search 函数定义在gcc 头文件目录的bits/STL_algo.h 中。

问题

  1. 为什么 std::binary_search 使用比较函数 (t2) 比没有它的版本 (t1) 快得多?
  2. 有时甚至 t1 比自制的二进制搜索程序 (t0) 更快。为什么 t0 这么慢以及如何加快它的速度?

更新:

random() 替换为 rand(),另请参阅 What difference between rand() and random() functions?

最佳答案

因为基准测试有缺陷。

  1. 您在循环(和定时)区域内调用 random:不仅它的运行时间有问题(并影响基准),而且还意味着您可能不会测量相同的运行时间基准
  2. 由于花费的时间取决于随机输出,您使用什么统计方法尽可能公平?平均超过 5 次交错运行 ?最好的 5 次交错运行? ...

现在,即使清除了瓦砾,您也可能会遇到标准算法比您自己的自制解决方案更快的情况。在这一点上,想想 C++ 的哲学:您不必为不需要的东西付费。因此,即使不进行优化,标准实现也可能至少 足够精简 与原始方法一样快:如果不是这样的话,它们已经修补了很长时间很久以前!

因此,最后,您需要检查差异。此时您需要深入研究代码并了解它是如何映射的。我建议使用源代码、LLVM IR 或程序集进行此探索(如果您不理解某些转换,请随时提问)。

也许正在进行一些展开?也许测试有更好的暗示?谁知道,在存在了几十年之后,您可能会发现一颗珍珠。

注意:要在 http://coliru.stacked-crooked.com 上获取 LLVM IR , 使用以下命令行 clang -O3 -S -emit-llvm -o main.ll main.cpp && cat main.ll

关于c++ - 为什么自制的二进制搜索算法比 std::binary_search 慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22934657/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com