- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
所以我写下了使用三种不同方法评估多项式的代码。霍纳的方法应该是最快的,而天真的方法应该是最慢的,对吧?但是为什么计算它的时间不是我所期望的呢?对于迭代和朴素方法,计算时间有时会完全相同。它有什么问题?
import numpy.random as npr
import time
def Horner(c,x):
p=0
for i in c[-1::-1]:
p = p*x+i
return p
def naive(c,x):
n = len(c)
p = 0
for i in range(len(c)):
p += c[i]*x**i
return p
def itera(c,x):
p = 0
xi = 1
for i in range(len(c)):
p += c[i]*xi
xi *= x
return p
c=npr.uniform(size=(500,1))
x=-1.34
start_time=time.time()
print Horner(c,x)
print time.time()-start_time
start_time=time.time()
print itera(c,x)
print time.time()-start_time
start_time=time.time()
print naive(c,x)
print time.time()-start_time
以下是一些结果:
[ 2.58646959e+69]
0.00699996948242
[ 2.58646959e+69]
0.00600004196167
[ 2.58646959e+69]
0.00600004196167
[ -3.30717922e+69]
0.00899982452393
[ -3.30717922e+69]
0.00600004196167
[ -3.30717922e+69]
0.00600004196167
[ -2.83469309e+69]
0.00999999046326
[ -2.83469309e+69]
0.00999999046326
[ -2.83469309e+69]
0.0120000839233
最佳答案
您的分析可以大大改善。此外,我们可以让您的代码运行速度提高 200-500 倍。
(1) 冲洗并重复
您不能只运行一次性能测试迭代,原因有二。
您不需要无数次运行(当然,这并没有什么坏处),但是您可以估计并调整迭代次数,直到方差在您的目的可接受的范围内。
timeit
是一个不错的小模块,用于分析 Python 代码。
我将此添加到您的脚本底部。
import timeit
n = 1000
print 'Horner', timeit.timeit(
number = n,
setup='from __main__ import Horner, c, x',
stmt='Horner(c,x)'
)
print 'naive', timeit.timeit(
number = n,
setup='from __main__ import naive, c, x',
stmt='naive(c,x)',
)
print 'itera', timeit.timeit(
number = n,
setup='from __main__ import itera, c, x',
stmt='itera(c,x)',
)
哪个产生
Horner 1.8656351566314697
naive 2.2408010959625244
itera 1.9751169681549072
Horner 是最快的,但它并没有完全击败其他两个。
(2) 看看发生了什么……非常仔细
Python 有运算符重载,所以很容易错过。
npr.uniform(size=(500,1))
为您提供 500 x 1 numpy 随机数结构。
那又怎样?
嗯,c[i]
不是数字。 这是一个带有一个元素的 numpy 数组。 Numpy 重载了运算符,因此您可以执行诸如将数组乘以标量之类的操作。
这很好,但是为每个元素使用一个数组很多开销,因此很难看出算法之间的差异。
相反,让我们尝试一个简单的 Python 列表:
import random
c = [random.random() for _ in range(500)]
现在,
Horner 0.034661054611206055
naive 0.12771987915039062
itera 0.07331395149230957
哇! 所有时间都变快了(快了 10-60 倍)。按比例,Horner 实现比其他两个更快。我们移除了所有三个的开销,现在可以看到“基本”的差异。
Horner 比 naive 快 4 倍,比 itera 快 2 倍。
(3) 备用运行时
您使用的是 Python 2。我假设是 2.7。
让我们看看 Python 3.4 的表现如何。 (语法调整:您需要在参数列表周围加上括号以 print
。)
Horner 0.03298933599944576
naive 0.13706714100044337
itera 0.06771054599812487
差不多。
让我们试试PyPy , Python 的 JIT 实现。 (“正常”的 Python 实现称为 CPython。)
Horner 0.006507158279418945
naive 0.07541298866271973
itera 0.005059003829956055
不错!现在,每个实现的运行速度都快了 2-5 倍。 Horner 现在的速度是 naive 的 10 倍,但比 itera 稍慢。
JIT 运行时比解释器更难分析。让我们将迭代次数增加到 50000 次,并尝试一下以确保。
Horner 0.12749004364013672
naive 3.2823100090026855
itera 0.06546688079833984
(请注意,我们有 50 倍的迭代,但只有 20 倍的时间……在前 1000 次运行中,JIT 并没有完全发挥作用。)同样的结论,但差异更加明显。
诚然,JIT 的想法是在运行时对程序进行剖析、分析和重写,因此如果您的目标是比较算法,这将添加很多不明显的实现细节。
不过,比较运行时有助于提供更广阔的视野。
还有一些事情。例如,您的幼稚实现会计算一个它从不使用的变量。您使用 range
而不是 xrange
。您可以尝试使用索引而不是反向切片向后迭代。等等。
这些对我来说都没有太大的改变,但它们值得考虑。
关于python - 在 Python 中实现霍纳方法的问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28250401/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!