python - 两个整数的 `min` 如何与 'bit hacking' 一样快？-6ren

python - 两个整数的 `min` 如何与 'bit hacking' 一样快？

转载作者：IT老高更新时间：2023-10-28 21:41:28

24

4

我正在观看“Bit Hacking”上的 lecture series，并发现了以下用于查找两个整数的最小值的优化:

return x ^ ((y ^ x) & -(x > y))

据说比:

if x < y:
    return x
else:
    return y

由于 min 函数不仅可以处理两个整数( float 、字符串、列表，甚至自定义对象)，我假设调用 min(x, y)会比上面优化的 bit hack 花费更长的时间。令我惊讶的是，它们几乎完全相同:

>>> python -m timeit "min(4, 5)"
1000000 loops, best of 3: 0.203 usec per loop

>>> python -m timeit "4 ^ ((5 ^ 4) & -(4 > 5))"
10000000 loops, best of 3: 0.19 usec per loop

即使对于大于 255 的数字也是如此(预分配的 Python 整数对象)

>>> python -m timeit "min(15456, 54657)"
10000000 loops, best of 3: 0.191 usec per loop

python -m timeit "15456 ^ ((54657 ^ 15456) & -(54657 > 15456))"
10000000 loops, best of 3: 0.18 usec per loop

像 min 这样用途广泛的函数为何还能如此快速和优化？

^{注意:我使用 Python 3.5 运行上述代码。我假设这与 Python 2.7+ 相同，但尚未测试}

我创建了以下 c 模块:

#include <Python.h>

static PyObject * my_min(PyObject *self, PyObject *args){
    const long x;
    const long y;

    if (!PyArg_ParseTuple(args, "ll", &x, &y))
        return NULL;

    return PyLong_FromLong(x ^ ((y ^ x) & -(x > y)));
}

static PyMethodDef MyMinMethods[] = 
{
    { "my_min", my_min, METH_VARARGS, "bit hack min"
    },
    {NULL, NULL, 0, NULL}
};

PyMODINIT_FUNC
initmymin(void)
{
    PyObject *m;

    m = Py_InitModule("mymin", MyMinMethods);
    if (m == NULL)
        return;

}

编译它，并将其安装到我的系统(ubuntu VM 机器)上。然后我运行了以下内容:

>>> python -m timeit 'min(4, 5)'
10000000 loops, best of 3: 0.11 usec per loop

>>> python -m timeit -s 'import mymin' 'mymin.my_min(4,5)'
10000000 loops, best of 3: 0.129 usec per loop

虽然我知道这是一台 VM 机器，但在将“位黑客”卸载到 native c 时，执行时间不应该还有更大的差距吗？

最佳答案

这可能是由于 min 函数在 python 中是如何实现的。

许多 python 内置函数实际上是用 C 或汇编等低级语言实现的，并使用 python api 以便在 python 中可调用。

在 C 中，您的位摆弄技术可能非常快，但在 python 中，语句的解释开销将远远超过调用甚至以低级语言实现的复杂函数的开销。

如果您真的想要一个公平的测试，将 C 程序或实现该技术的 C python 扩展与您的 min 的 python 调用进行比较并查看它的比较，我希望这将解释您看到的结果.

编辑:

感谢@Two-BitAlchemist，我现在可以提供更多详细信息，说明这个位旋转在 python 中无法正常工作的其他原因。看起来整数并没有以明显的方式存储，但实际上是一个相当复杂的扩展对象，旨在存储可能非常大的数字。

可以找到一些关于此的详细信息 here (感谢 Two-BitAlchemist)虽然看起来这在较新的 python 版本中有所改变。仍然有一点是，当我们在 python 中触摸整数时，我们肯定不是在操作一组简单的位，而是在一个复杂的对象中，位操作实际上是具有巨大开销的虚拟方法调用(与它们所做的相比)。

关于python - 两个整数的 `min` 如何与 'bit hacking' 一样快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33784519/

24

4

0

文章推荐： python - 如何在 Python 2.6 中获取 argparse？

文章推荐： Android/iOS 点对点架构

文章推荐： c++ - C++中是否存在真正的静态多态性？

文章推荐： android - 从包中发布的错误通知无法展开 RemoteViews

bit.dev - 是否可以在没有 bit.dev 帐户的情况下使用 Bit？
是否可以在没有 bit.dev 帐户的情况下将 bit 设置为本地服务器以进行内部处理？我知道您可能没有相同的功能 -- bit's FAQ page说“与 Bit CLI 不同，bit.dev 服
c - 对名为 'full_adder(BIT A, BIT B, BIT Ci, BIT *Co)' 的函数的 undefined reference
我是一名计算机科学学生，学习如何用 C 语言编程。我有 3 个文件和一个 Makefile。我有 logic.c logic.h main.c logic.c 的顶部是: #include "log
C 字节序转换 : bit by bit
我有一个特殊的无符号长整型(32 位)，我需要一点一点地转换它的字节序 - 我的长整型表示将多个内容混合在一起形成一个二进制文件。我该怎么做？最佳答案字节顺序是一个字级概念，其中字节要么以最高有
iOS Xcode : building a 32-bit project with a 32-bit/64-bit subproject
我有许多 iOS Xcode 项目都使用同一个子项目。这个子项目构建一个静态库，然后链接到主项目。到目前为止，这个子项目和所有主项目都是 32 位的。我想构建一个支持 64 位的新项目，因此将架构设
c - SIMD signed with unsigned multiplication for 64-bit * 64-bit to 128-bit
我创建了一个使用 SIMD 执行 64 位 * 64 位到 128 位的函数。目前我已经使用 SSE2(实际上是 SSE4.1)实现了它。这意味着它同时处理两个 64b*64b 到 128b 的产品。
bit-manipulation - Bit Twiddle 执行此转换
想知道是否有人对我如何对二进制数执行以下操作有一些了解: 转换 01+0 -> 10+1 (+ as in regular expressions, one or more) 01 ->
bit-manipulation - 来自 bit twiddling 网站的问题
代码如下: unsigned int v; // word value to compute the parity of v ^= v >> 16; v ^= v >> 8; v ^= v >> 4
javascript - 如果一种语言没有 "bit to bit"比较，我该如何模拟它？
我正在尝试在(测试版)Trackmania 2 游戏中制作脚本。(这是 JavaScript、HTML、C 和...其他我在最糟糕的噩梦中无法想象的东西的丑陋混合)。脚本引擎似乎不知道“and”或“
汇编语言 : 8 bit versions of 64 bit registers?
这个问题在这里已经有了答案: How do AX, AH, AL map onto EAX? (6 个回答) 去年关闭。所以，假设我正在使用寄存器 %rax和 %rdi . 作为一个基本的例子，让我
64-bit - 处理器，操作系统:32bit，64 bit
我是编程新手，来自非CS背景(没有正式学位)。我主要使用C#编写Winforms。我对32位和64位感到困惑...。我的意思是，听说过32位OS，32位处理器以及基于程序的最大内存。它如何影响程序的
bit-manipulation - 整数 "Clear the 6th bit"的最佳方法是什么？
“清除整数的第 6 位”的最佳方法是什么？而且，您的解决方案平台是否独立？ (32 位或 64 位整数等)。如果没有，您能否提供一个独立于平台的解决方案？更新: 我们不知道该位在给出时是已设置还是
c++ - union int bits to float bits 有时解释错误
我刚刚在交错一些 float 时发现了一些狡猾的问题。我简化了问题并尝试了一些测试 #include #include std::vector v; // global instance unio
c++ - "bit padding"或 "padding bits"到底是什么？
我不想用这个来骚扰你，但我在互联网上的任何地方都找不到对“位填充”到底是什么的详细解释，也没有找到与位填充相关的线程的任何答案在 StackOverflow 上。我还在 ISO 9899-1990
c - "data bit"容量与 "overhead bit"大小？
我有点卡住了，因为我找不到任何涵盖缓存“数据”部分的内容，我用谷歌搜索的所有内容都涉及 99.9% 的缓存寻址。我被问到的问题是这样措辞的 Contrast the difference betwee
c - 性能比较 : 64 bit and 32 bit multiplication
关闭。这个问题需要debugging details .它目前不接受答案。编辑问题以包含 desired behavior, a specific problem or error, and th
德尔福XE2 : Debug a 64 bit dll through a 64 bit app
是否有人通过运行/附加到 64 位应用程序成功调试 64 位 dll？我有应用程序和 dll 的 Delphi 代码。我可以调试 32 位和 64 位应用程序。我还可以通过使用 Run -> Para
安卓 JNI : 32-bit compatability with 64-bit devices?
我有一些使用 native 组件的库，这些库是使用 NDK 为 32 位 Arm 架构构建的。现在我们在现代设备上有 64 位处理器，所以我想知道这些库是否可以工作。在我的情况下，我没有本地库的源代
mysql - 安全散列 SSN 以适合 BIT 列或扩展 BIT 列以适合安全散列？
这是我上一个问题的延伸 - How to securely and efficiently store SSN in a database? 这个想法是，我想要安全地散列社会安全号码，然后插入到列中，
java - 数学技能较弱 : What is an 8-bit numerator and 8-bit denominator?
我很尴尬地说，我的数学技能很弱，而且我是一名自豪的计算机科学专业。我正在上课，这真是太令人难以承受了。这是我家庭作业的一部分，但是，在理解这一部分之前我无法继续。我类的每个人都在努力编写某种方法来完成
java - InnoSetup : Detect if Java is 32-bit or 64-bit
在 InnoSetup 中我运行这段代码: J32 := ShellExec('', 'java', '-d32 -version', '', SW_HIDE, ewWaitUntilTerminat

首页

博学

6Ren·AI

商城

python - 两个整数的 `min` 如何与 'bit hacking' 一样快？