- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
用例
一个简单的函数,用于检查特定字符串是否位于另一个字符串中的 3 倍数位置(参见此处的 real world example,查找终止密码子在 DNA 序列中)。
函数sliding_window
:将长度为 3 的字符串与搜索字符串进行比较,如果相同则向前移动 3 个字符。incremental_start
:尝试查找搜索字符串,如果找到的位置不是 3 的倍数,则尝试找到找到位置之后的下一个位置。
请注意:示例数据只是为了确保每个函数都必须遍历完整的字符串,性能与真实数据或随机数据相似。
结果
incremental_start
,可以将初始的 sliding_window
函数提高约 39 倍Windows 10。Ubuntu 上的性能提升略有下降,~34x、~37x、~18x(VM、AWS、 native ),但仍在同一范围内。sliding_window
变得比 Python2.7 慢(在 Windows 上为 1.8x,在所有 Ubuntu 上为 1.4x resp. 1.5x),但是 incremental_start
性能在所有 Ubuntu 上下降了 4、5、1.7 倍(VM、AWS、 native ),而在 Windows 上几乎没有变化。incremental_start
较慢,而 sliding_window
快 40%。sliding_window
函数需要更少的时间来完成 (~50%),而 incremental_start
变慢了~2-3 倍.问题
代码
import timeit
text = 'ATG' * 10**6
word = 'TAG'
def sliding_window(text, word):
for pos in range(0, len(text), 3):
if text[pos:pos + 3] == word:
return False
return True
def incremental_start(text, word):
start = 0
while start != -1:
start = text.find(word, start + 1)
if start % 3 == 0:
return False
return True
#sliding window
time = timeit.Timer(lambda: sliding_window(text, word), setup='from __main__ import text, word').timeit(number=10)
print('%3.3f' % time)
#incremental start
time = timeit.Timer(lambda: incremental_start(text, word), setup='from __main__ import text, word').timeit(number=500)
print('%3.3f' % time)
表格
Ubuntu vs Windows VM AWS Native
Python2.7-Increment 79% 73% 126%
Python2.7-Sliding 70% 70% 60%
Python3.4-Increment 307% 346% 201%
Python3.4-Sliding 54% 59% 48%
Py2 vs 3 Windows VM AWS Native
Increment 105% 409% 501% 168%
Sliding 184% 143% 155% 147%
Absolute times in seconds
Win10 Ubuntu AWS Native
Py2.7-Increment 1.759 1.391 1.279 2.215
Py2.7-Sliding 1.361 0.955 0.958 0.823
Py3.4-Increment 1.853 5.692 6.406 3.722
Py3.4-Sliding 2.507 1.365 1.482 1.214
详情
Windows 10: native Windows、32 位 Python 3.4.3 或 2.7.9、i5-2500、16GB RAM
Ubuntu虚拟机:14.04,运行在Windows主机上,64位Python 3.4.3,Python 2.7.6,4核,4GB RAM
AWS:14.04,AWS 微实例,64 位 Python 3.4.3,Python 2.7.6
native Ubuntu:14.04、64 位 Python 3.4.3、Python 2.7.6、i5-2500、16GB 内存 [与 Win10 机器相同]
根据 Ingaz 的建议,使用了 xrange
和 bytes
,性能略有提高,但在使用 Python3.4 的 Ubuntu 上性能仍然大幅下降。罪魁祸首似乎是 find
,当 Ubuntu 和 Py3.4 结合使用时它要慢得多(与从源代码编译的 Py3.5 相同)。这似乎依赖于 Linux 风格,在 Debian Py2.7 和 Py3.4 上执行相同,在 RedHat Py2.7 上比 Py3.4 快得多。
为了更好地比较 Py3.4 现在在 Windows10 和 Ubuntu 的 64 位中使用。 Win10 上仍然使用 Py27。
import timeit, sys
if sys.version_info >= (3,0):
from builtins import range as xrange
def sliding_window(text, word):
for pos in range(0, len(text), 3):
if text[pos:pos + 3] == word:
return False
return True
def xsliding_window(text, word):
for pos in xrange(0, len(text), 3):
if text[pos:pos + 3] == word:
return False
return True
def incremental_start(text, word):
start = 0
while start != -1:
start = text.find(word, start + 1)
if start % 3 == 0:
return False
return True
text = 'aaa' * 10**6
word = 'aaA'
byte_text = b'aaa' * 10**6
byte_word = b'aaA'
time = timeit.Timer(lambda: sliding_window(text, word), setup='from __main__ import text, word').timeit(number=10)
print('Sliding, regular: %3.3f' % time)
time = timeit.Timer(lambda: incremental_start(text, word), setup='from __main__ import text, word').timeit(number=500)
print('Incremental, regular: %3.3f' % time)
time = timeit.Timer(lambda: sliding_window(byte_text, byte_word), setup='from __main__ import byte_text, byte_word').timeit(number=10)
print('Sliding, byte string: %3.3f' % time)
time = timeit.Timer(lambda: incremental_start(byte_text, byte_word), setup='from __main__ import byte_text, byte_word').timeit(number=500)
print('Incremental, bytes: %3.3f' % time)
time = timeit.Timer(lambda: xsliding_window(byte_text, byte_word), setup='from __main__ import byte_text, byte_word').timeit(number=10)
print('Sliding, xrange&bytes: %3.3f' % time)
time = timeit.Timer(lambda: text.find(word), setup='from __main__ import text, word').timeit(number=1000)
print('simple find in string: %3.3f' % time)
Win10-py27 Wi10-py35 VM-py27 VM-py34
1.440 2.674 0.993 1.368
1.864 1.425 1.436 5.711
1.439 2.388 1.048 1.219
1.887 1.405 1.429 5.750
1.332 2.356 0.772 1.224
3.756 2.811 2.818 11.361
最佳答案
虽然您测量的是相同代码的速度,但您的代码中的结构是不同的。
一个。 range
在 2.7 中是 type 'list'
,range 在 3.4 中是 class 'range'
B. 'ATG' * 10**6 在 2.7 中是一个字节字符串,在 3.4 中是和 unicode 字符串
如果出现以下情况,您可以尝试生成更兼容的结果:a) 对 2.7 变体使用 xrange,b) 在两个示例中使用 bytes
字符串:b'ATG'
或 unicode两个示例中的字符串。
我怀疑性能差异源于主要因素:a) 32 位与 64 位,b) C 编译器。
所以,我做了以下测试:
我预计:
Test as32b as64b off32b off64b ubw64b pypy5.1.1
Sliding, regular: 1.232 1.230 1.281 1.136 0.951 0.099
Incremental, regular: 1.744 1.690 2.219 1.647 1.472 2.772
Sliding, byte string: 1.223 1.207 1.280 1.127 0.926 0.101
Incremental, bytes: 1.720 1.701 2.206 1.646 1.568 2.774
Sliding, xrange&bytes: 1.117 1.102 1.162 0.962 0.779 0.109
simple find in string: 3.443 3.412 4.607 3.300 2.487 0.289
Windows 10 上的赢家是......由 GCC 4.8.2 为 Linux 编译的 Ubuntu Python!
这个结果完全出乎我的意料。
32 与 64:变得无关紧要。
PyPy:一如既往的 super 快,除非不是。
我无法解释这个结果,OP 问题变得不像看起来那么简单。
关于python - 字符串性能 - Windows 10 与 Ubuntu 下的 Python 2.7 与 Python 3.4,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37052139/
我正在尝试使用以下命令在远程 Ubuntu 服务器的后台运行进程: sshpass -p PASSWORD ssh root@HOST 'nohup COMMAND-THAT-BLOCKS &' 不幸
普通 Ubuntu 和 ARM Ubuntu 有什么区别。我可以运行所有应用程序吗也在 ARM Ubuntu 中的普通 Ubuntu 下运行? Ubuntu 更新会自动发生吗? Torrent 下载器
关闭。这个问题是off-topic .它目前不接受答案。 想改进这个问题? Update the question所以它是on-topic对于堆栈溢出。 9年前关闭。 Improve this que
我正在尝试预置 Xenial 图像,它工作得很好,除了分区。 cloud-init 只能增长根分区,并且在使用扩展分区内的根文件系统构建镜像时不起作用: NAME MAJ:MIN RM SIZ
我对 Ubuntu 和 OpenFoam 真的很陌生,所以尝试学习并做一些教程。我正在使用 Docker 在 Ubuntu 上使用 OpenFoam。 我将文件夹复制到特定目录,但是当我尝试使用终端访
我在使用系统启动设置运行软件时遇到问题。我有 ubuntu 20.04。我试图将这些行插入到 etc/rc.local #!/bin/bash /usr/bin/clamonacc 它不起作用。第二次
TARGETS = client server CL_OBJ = clientMain.o Controller.o UI.o List.o Movie.o Server.o Serializer.o
我有一个 ubuntu服务器系统是8.04 hardy ,我在哪里安装rabbitmq。 rabbitmq依赖于 erlang-nox (>= 1:12.b.3) ,但是在当前的 ubuntu 版本中
我有一个用于开发的 Ubuntu virtualbox 设置。当我在文件中处于 org-mode 时,org-mode 的任何热键都不起作用(例如 M-RETURN 用于创建新标题)。我该怎么做才能让
我的 SchemaCrawler(版本 15.01.03)模式图在 Ubuntu 18.04 LTS 上截断表名。看起来表格通常被画得太窄,因为“[TABLE]”符号也开箱即用。在我的 Mac 上渲染
在 Ubuntu 中,设置应用程序中有几个地方有一个非常漂亮的 ListView ,带有添加/删除按钮,包括外观、键盘布局、隐私、蓝牙等。他们使用什么小部件?我开始使用 Glade 开发我的第一个 U
需要帮助卸载 jjrofiler。没有意识到它需要许可证。通过 .sh 可执行文件安装。 最佳答案 如果您转到 jProfiler 安装目录,您将找到名为 uninstall 的可执行文件,只需从终端
我一直在寻找几天,我没有想出解决方案。我是 ruby 新手,但我想通过使用 spree 开发自己的在线商店。 我使用:rails:Rails 3.2.13 ruby :ruby-1.9.3-p42
我尝试使用以下命令从/usr/local/bin 中删除我的 python2.7 和 python3 文件夹:sudo rm -rf python2.7 和 sudo rm -rf python3。后
在 ubuntu 服务器中(使用 ssh 协议(protocol)), 如何更改因不活动而断开连接的时间? 最佳答案 你能在 .bash_profile 中加入“exec screen -R”,在 .
我使用以下配置在 /etc/apache2/site-available/mysite.local 中创建了一个虚拟主机: ServerAdmin webmaster@localhost
我为大约 210 个用户新设置了一个代理服务器。它运行 ubuntu server 2012 和 squid3。问题是在凌晨 1:30 之后,如果用户尝试打开 google.com、youtube.c
gitlab-ci-multi-runner 1.0.2 (ea19241) Using Shell executor... Running on ip-... Cloning repository.
我有一个备份服务器,它每小时接收许多 rsync 连接。由于打开太多 rsync 实例可能会导致崩溃,我想使用 Semaphore 来限制并发实例的数量。 .我的想法是这样的: ssh root@ba
我有同一个库的多个版本,我的程序动态链接到这些库。有时我想更改使用的版本。 我一直在阅读,出于安全原因,新版本的 Ubuntu 不再支持 LD_LIBRARY_PATH。我可以将路径添加到 /etc/
我是一名优秀的程序员,十分优秀!