- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我最近一直致力于创建素数查找程序。但是,我开始注意到一个函数在使用参数时比在使用预设值时慢得多。
在 3 个不同的版本中,很明显变量显着减慢了程序速度,我想知道原因。
这是原始的(针对这个问题做了一些简化)函数:
def version1(n, p):
return ((n*n - 2) & ((1 << p) - 1)) + ((n*n - 2) >> p)
当使用 timeit
模块运行 100 次时:
timeit.timeit("version1(200, 500000000)", "from __main__ import version1", number=100)
需要 7.5
秒。
不过,这里是第二个版本,没有参数,数字直接放在返回值中。该等式与版本 1 完全相同:
def version2():
return ((200*200 - 2) & ((1 << 500000000) - 1)) + ((200*200 - 2) >> 500000000)
当使用 timeit
模块运行 100 次时:
timeit.timeit("version2()", "from __main__ import version2", number=100
这只需要 0.00001
秒!
最后,为了完整性,我尝试了一个没有参数的版本,但仍然将其值保留为变量:
def version3():
n = 200
p = 500000000
return ((n*n - 2) & ((1 << p) - 1)) + ((n*n - 2) >> p)
当使用 timeit
运行时:
timeit.timeit("version3()", "from __main__ import version3", number = 100)
耗时 6.3
秒,相对接近版本 1。
为什么当涉及到变量时,相同的函数会花费如此长的时间,我如何才能使版本 1 更高效?
最佳答案
Python 在编译时预先计算计算为所谓的 peep-hole optimisation :
>>> import dis
>>> def version2():
... return ((200*200 - 2) & ((1 << 500000000) - 1)) + ((200*200 - 2) >> 500000000)
...
>>> dis.dis(version2)
2 0 LOAD_CONST 13 (39998)
2 RETURN_VALUE
version2()
返回已计算的值,并且不做任何实际工作。返回一个常量当然比每次都计算值要快得多。
参见 fold_binops_on_constants
function在 peephole.c
Python 源文件中了解有关编译器如何执行此操作的详细信息。
因此,编译 version2
比 version1
花费(很多)时间:
>>> import timeit
>>> version1_text = '''\
... def version1(n, p):
... return ((n*n - 2) & ((1 << p) - 1)) + ((n*n - 2) >> p)
... '''
>>> version2_text = '''\
... def version2():
... return ((200*200 - 2) & ((1 << 500000000) - 1)) + ((200*200 - 2) >> 500000000)
... '''
>>> timeit.timeit("compile(t, '', 'exec')", 'from __main__ import version1_text as t', number=10)
0.00028649598243646324
>>> timeit.timeit("compile(t, '', 'exec')", 'from __main__ import version2_text as t', number=10)
2.2103765579813626
幸好 Python 缓存了编译的字节码结果!
每个子表达式的中间结果也存储在代码对象的co_consts
属性中,其中一些比较大:
>>> import sys
>>> consts = version2.__code__.co_consts
>>> for obj in consts:
... size = sys.getsizeof(obj)
... print(f'{type(obj)!s:<18} {size:<8} {"<too large to print>" if size > 100 else obj}')
...
<class 'NoneType'> 16 None
<class 'int'> 28 200
<class 'int'> 28 2
<class 'int'> 28 1
<class 'int'> 28 500000000
<class 'int'> 28 40000
<class 'int'> 28 39998
<class 'int'> 66666692 <too large to print>
<class 'int'> 66666692 <too large to print>
<class 'int'> 28 39998
<class 'int'> 28 40000
<class 'int'> 28 39998
<class 'int'> 24 0
<class 'int'> 28 39998
所以这确实让字节码缓存变大了一点:
>>> import marshal
>>> len(marshal.dumps(version1.__code__))
129
>>> len(marshal.dumps(version2.__code__))
133333481
包含非参数版本的模块的 .pyc
文件至少有 127MB!
关于python - 为什么使用参数会使这个函数慢得多?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43823807/
简而言之:我想从可变参数模板参数中提取各种选项,但不仅通过标签而且通过那些参数的索引,这些参数是未知的 标签。我喜欢 boost 中的方法(例如 heap 或 lockfree 策略),但想让它与 S
我可以对单元格中的 excel IF 语句提供一些帮助吗? 它在做什么? 对“BaselineAmount”进行了哪些评估? =IF(BaselineAmount, (Variance/Baselin
我正在使用以下方法: public async Task Save(Foo foo,out int param) { ....... MySqlParameter prmparamID
我正在使用 CodeGear RAD Studio IDE。 为了使用命令行参数测试我的应用程序,我多次使用了“运行 -> 参数”菜单中的“参数”字段。 但是每次我给它提供一个新值时,它都无法从“下拉
我已经为信用卡类编写了一些代码,粘贴在下面。我有一个接受上述变量的构造函数,并且正在研究一些方法将这些变量格式化为字符串,以便最终输出将类似于 号码:1234 5678 9012 3456 截止日期:
MySql IN 参数 - 在存储过程中使用时,VarChar IN 参数 val 是否需要单引号? 我已经像平常一样创建了经典 ASP 代码,但我没有更新该列。 我需要引用 VarChar 参数吗?
给出了下面的开始,但似乎不知道如何完成它。本质上,如果我调用 myTest([one, Two, Three], 2); 它应该返回元素 third。必须使用for循环来找到我的解决方案。 funct
将 1113355579999 作为参数传递时,该值在函数内部变为 959050335。 调用(main.c): printf("%d\n", FindCommonDigit(111335557999
这个问题在这里已经有了答案: Is Java "pass-by-reference" or "pass-by-value"? (92 个回答) 关闭9年前。 public class StackOve
我真的很困惑,当像 1 == scanf("%lg", &entry) 交换为 scanf("%lg", &entry) == 1 没有区别。我的实验书上说的是前者,而我觉得后者是可以理解的。 1 =
我正在尝试使用调用 SetupDiGetDeviceRegistryProperty 的函数使用德尔福 7。该调用来自示例函数 SetupEnumAvailableComPorts .它看起来像这样:
我需要在现有项目上实现一些事件的显示。我无法更改数据库结构。 在我的 Controller 中,我(从 ajax 请求)传递了一个时间戳,并且我需要显示之前的 8 个事件。因此,如果时间戳是(转换后)
rails 新手。按照多态关联的教程,我遇到了这个以在create 和destroy 中设置@client。 @client = Client.find(params[:client_id] || p
通过将 VM 参数设置为 -Xmx1024m,我能够通过 Eclipse 运行 Java 程序-Xms256M。现在我想通过 Windows 中的 .bat 文件运行相同的 Java 程序 (jar)
我有一个 Delphi DLL,它在被 Delphi 应用程序调用时工作并导出声明为的方法: Procedure ProduceOutput(request,inputs:widestring; va
浏览完文档和示例后,我还没有弄清楚 schema.yaml 文件中的参数到底用在哪里。 在此处使用 AWS 代码示例:https://github.com/aws-samples/aws-proton
程序参数: procedure get_user_profile ( i_attuid in ras_user.attuid%type, i_data_group in data_g
我有一个字符串作为参数传递给我的存储过程。 dim AgentString as String = " 'test1', 'test2', 'test3' " 我想在 IN 中使用该参数声明。 AND
这个问题已经有答案了: When should I use "this" in a class? (17 个回答) 已关闭 6 年前。 我运行了一些java代码,我看到了一些我不太明白的东西。为什么下
我输入 scroll(0,10,200,10);但是当它运行时,它会传递字符串“xxpos”或“yypos”,我确实在没有撇号的情况下尝试过,但它就是行不通。 scroll = function(xp
我是一名优秀的程序员,十分优秀!