python - 为什么在 python 中使用指数取模更快？-6ren

python - 为什么在 python 中使用指数取模更快？

转载作者：太空狗更新时间：2023-10-29 17:24:33

26

4

我试图优化我正在修补的程序，当我注意到执行 value = i % 65536 似乎比执行 value = i % (2* *16)。

为了对此进行测试，我运行了以下程序:

import cProfile
import pstats

AMOUNT = 100000000

def test1():
    for i in xrange(AMOUNT):
        value = i % 65536
    return

def test2():
    for i in xrange(AMOUNT):
        value = i % (256**2)
    return

def test3():
    for i in xrange(AMOUNT):
        value = i % (16**4)
    return

def test4():
    for i in xrange(AMOUNT):
        value = i % (4**8)
    return

def test5():
    for i in xrange(AMOUNT):
        value = i % (2**16)
    return

def run_tests():
    test1()
    test2()
    test3()
    test4()
    test5()
    return

if __name__ == '__main__':
    cProfile.run('run_tests()', 'results')
    stats = pstats.Stats('results')
    stats.sort_stats('calls', 'nfl')
    stats.print_stats()

...产生了以下输出:

Fri May 11 15:11:59 2012    results

         8 function calls in 40.473 seconds

   Ordered by: call count, name/file/line

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}
        1    0.000    0.000   40.473   40.473 <string>:1(<module>)
        1    0.000    0.000   40.473   40.473 test.py:31(run_tests)
        1   10.466   10.466   10.466   10.466 test.py:6(test1)
        1    7.475    7.475    7.475    7.475 test.py:11(test2)
        1    7.485    7.485    7.485    7.485 test.py:16(test3)
        1    7.539    7.539    7.539    7.539 test.py:21(test4)
        1    7.508    7.508    7.508    7.508 test.py:26(test5)

使用 65536 最慢，为 10.466 秒，而使用 256**2 最快，为 7.475 秒(其他可能的指数值介于两者之间)。诚然，这种速度差异只有在大量重复的情况下才会明显，但我仍然很好奇为什么会出现这种情况。

为什么用 65536 取模比用指数取模慢？他们应该评估为相同的数字，我原以为 python 解释器在采用 mod 之前完全评估指数会花费更长的时间。

推而广之，在 python 表达式中使用 2 的幂通常比完全输入数字更有效吗？这种模式是否适用于模数以外的运算或 2 以外的其他数字？

(顺便说一句，我使用的是 Python 2.7.2(32 位)，并且我在 64 位 Windows 7 笔记本电脑上运行了上面的代码)。

编辑:
所以我尝试颠倒我调用的函数的顺序，现在正好相反。看起来无论 run_tests 中的第一个函数是什么，在使用 cProfile 时总是会运行得慢一些，这很很奇怪。所以，吸取教训，我猜 -- 分析器很奇怪 :D

最佳答案

生成的字节码没有区别，因为编译器完成了它的工作并优化了常量算术表达式。这意味着您的测试结果只是巧合(尝试以不同的顺序对函数计时!)。

>>> import dis
>>> dis.dis(test1)
  2           0 SETUP_LOOP              30 (to 33)
              3 LOAD_GLOBAL              0 (xrange)
              6 LOAD_GLOBAL              1 (AMOUNT)
              9 CALL_FUNCTION            1
             12 GET_ITER            
        >>   13 FOR_ITER                16 (to 32)
             16 STORE_FAST               0 (i)

  3          19 LOAD_FAST                0 (i)
             22 LOAD_CONST               1 (65536)
             25 BINARY_MODULO       
             26 STORE_FAST               1 (value)
             29 JUMP_ABSOLUTE           13
        >>   32 POP_BLOCK           

  4     >>   33 LOAD_CONST               0 (None)
             36 RETURN_VALUE        
>>> dis.dis(test5)
  2           0 SETUP_LOOP              30 (to 33)
              3 LOAD_GLOBAL              0 (xrange)
              6 LOAD_GLOBAL              1 (AMOUNT)
              9 CALL_FUNCTION            1
             12 GET_ITER            
        >>   13 FOR_ITER                16 (to 32)
             16 STORE_FAST               0 (i)

  3          19 LOAD_FAST                0 (i)
             22 LOAD_CONST               3 (65536)
             25 BINARY_MODULO       
             26 STORE_FAST               1 (value)
             29 JUMP_ABSOLUTE           13
        >>   32 POP_BLOCK           

  4     >>   33 LOAD_CONST               0 (None)
             36 RETURN_VALUE

(实际上是有区别的:数字存储在常量表中的不同偏移量处。不过，我无法想象这会造成任何差异)。

为了完整性，这里有一个使用 timeit 模块的正确测试:

import timeit

setup = "i = 1337"

best1 = best2 = float("inf")
for _ in range(5000):
  best1 = min(best1, timeit.timeit("i % 65536", setup=setup, number=10000))
for _ in range(5000):
  best2 = min(best2, timeit.timeit("i % (2**16)", setup=setup, number=10000))
print best1
print best2

请注意，我测量的是所需的最小时间，而不是平均时间。如果由于某种原因需要更长的时间，这仅意味着它被更频繁地中断(因为代码除了 CPU 的能力外不依赖于任何东西)。

关于python - 为什么在 python 中使用指数取模更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/10559392/

26

4

0

文章推荐： python - 如何使qmenu项目可检查pyqt4 python

文章推荐：用于自定义图例的 Angular ngx-charts 选项？

文章推荐： python - 在 Windows 上轻松安装 cx_Oracle(python 包)

algorithm - n!模 m , a^p 模 m
是否有更快的算法来计算 (n! modulo m)。在每个乘法步骤都比减少更快。并且有没有比左右二元法更快的算法来计算 (a^p modulo m)。这是我的代码:n!模数m ans=1 for(i
javascript - if 条件满足但不适用(模)
我有非常简单的代码循环遍历数组中的元素并检查是否index % 2 == 0。如果是这样，它应该改变颜色。 var e = document.getElementById("list").childN
javascript - 模 - 计算错误
让我简短一点。我正在计算 alert((Math.pow(7,35))%71) 但它给了我 61，而结果必须是 70。怎么了？最佳答案正如其他人之前提到的关于使用 Math.pow(7,35) 的
gcc - 模(%)的GCC实现是如何工作的，为什么不使用div指令？
我试图弄清楚如何在汇编中计算模 10，所以我在 gcc 中编译了以下 c 代码，看看它想出了什么。 unsigned int i=999; unsigned int j=i%10; 令我惊讶的是我得到
java - 如何在不使用 "%"运算符的情况下计算两个数字的余数/模？
例如使用以下输入: int num = -100 int divisor = 10 => -100 mod 10 = 0 (Edge-case: negative numbers as inpu
C++ rand() 模 float
这个问题在这里已经有了答案: Random float number generation (14 个答案) 关闭 9 年前。在 C++ 中，我希望得到一个随机 float 。据我所知，典型的随机
c - 相同除数时快速 AVX512 模
我试图找到潜在阶乘素数的除数(n!+-1 形式的数)，因为我最近购买了 Skylake-X 工作站，我认为我可以使用 AVX512 指令提高一些速度。算法简单，主要步骤是对同一个除数重复取模。主要是
math - 如何找到与 i 模 m 一致的最小正整数？
我有一个保存角度(以度为单位)的变量，该角度可以是正值也可以是负值。我现在需要确保该数字仅在 0 到 360 之间。该数字是 double 。执行此操作的好算法是什么？简单地执行角度 % 360 是
swift - CheckSum8 模 256 Swift
我有一个 UInt8 数组，我想计算 CheckSum8 模 256。如果字节总和小于 255，checkSum 函数返回正确的值。例如 let bytes1 : [UInt8] = [1, 0xa
我可以依赖 C 中的 %(模)运算符来获取负数吗？
使用海湾合作委员会: printf("%i \n", -1 % (int)4); printf("%u \n", -1 % (unsigned int)4); 输出: -1 3 我可以跨平台依赖这种行
c++ - 模 : The Purpose of An Undefined Integer
我无法理解代码中几行的含义。我最近开始学习 C++，并阅读了 Bjarne Stroustrup 的“编程:使用 C++ 的原理和实践”。第四章有个问题让我很困惑，所以我在网上搜索了一个解决方案以供引
algorithm - 解释以下算法以求 nCr 模 P
我试图解决一个涉及大阶乘模质数的问题，并在另一个人的解决方案中发现了以下算法: long long factMod (long long n, long long p) { long long
java - 斐波那契 n 模 m
我正在尝试计算 𝐹𝑛 模 𝑚，其中 𝑛 可能非常大:高达 10^18，𝐹𝑛 是第 n 个斐波那契数这是我的代码，它适用于小数字，但对于大数字，它会抛出 OutOfMemoryError 或
algorithm - 检查循环(模 16)数是否大于另一个？
我有两个以 16 为模的循环整数，因此它们的值介于 0 和 15 之间。我需要比较两个数字以确定 n_1 是否大于 n_0 n_1 > n_0 很明显，这个没有准确定义，所以我定义n_1如果小于前面
java - 一些 Java 模/余数运算符问题
我一直在尝试使用 Java 处理一些更大的值，但遇到了一些我不理解的问题。出于某种原因，Java 似乎喜欢给我垃圾数据(尽管，我更可能告诉它给我垃圾数据) 这是一个片段，为清楚起见进行了编辑:
c++ - 模 - gcc 的操作数顺序错误？还是UB？
好吧，我今天做了一个小函数，它应该会生成一个随机字符串。 std::string randString(size_t length) { std::string randStr; fo
带负数的 Ruby 模 3 不直观
Ruby 的负数取模规则不明确。在 IRB 中: -7 % 3 == 2 应该是1!为什么？最佳答案因为 -7/3 在 Ruby 的整数除法语义下是 -3。 3*-3 是 -9，所以会留下 2
javascript - 模 % 大数 - 无穷大错误 - Javascript
这个问题在这里已经有了答案: Calculating pow(a,b) mod n (14 个答案) 关闭 6 年前。在 Javascript 中是否有获取大数模数的技巧。我用 modulo(7,
lua - 2^65 模 101 错误答案
此代码使用公式 (a^x) % 101 检查值 a 是否唯一映射到值 1 到 100 local function f(a) found = {} bijective = true
java - 模 32 或 64 约简是什么？
在《Core Java Volume1》一书中有一条警告: CAUTION: The right-hand side argument of the shift operators is reduce

首页

博学

6Ren·AI

商城

python - 为什么在 python 中使用指数取模更快？