- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有这个故意不高效的代码:
def suffix_array_alternative_naive(s):
return [rank for suffix, rank in sorted((s[i:], i) for i in range(len(s)))]
from random import randint
constant_string = lambda length: 'a' * length
random_string = lambda length: ''.join(chr(randint(0, 255)) for _ in range(length))
length = 10000
s1 = constant_string(length)
s2 = random_string(length)
from time import time
for s in [s1, s2]:
d = time()
for _ in range(10):
suffix_array_alternative_naive(s)
print(time()-d)
2.0367980003356934
1.9366297721862793
使用 python3:
如果我尝试使用 length = 100000 和一个循环:
0.48073387145996094
0.5416769981384277
pypy3:
48.4867467880249
35.002175092697144
4.402702808380127
4.469300031661987
通常情况下,常量字符串应该更长以便在它们之间进行比较,因为您必须完整地读取它们,而随机字符串应该很容易避免后缀前缀之间的冲突。因此,pypy3 的结果是合乎逻辑的。
为什么它在 CPython 中不能那样工作?
最佳答案
由于 Python 中字符串的内部格式,您的“常量”字符串比随机字符串小。
>>> sys.getsizeof('\x7f')
50
>>> sys.getsizeof('\x80')
74
CPython 使用优化来存储 ASCII 字符串比非 ASCII 字符串更紧凑。为避免这种差异,请使用 randint(0, 127)
,它将生成仅 ASCII 的常量字符串。或者使用非 ASCII 字符代替 'a'
。
最重要的是,常量字符串已经排序。 CPython 的排序算法是 Timsort,它以针对某些情况进行优化而闻名,例如已排序或反向排序的输入。
import random
import timeit
def constant_string(length):
return 'a' * length
def random_string(length):
return ''.join(chr(random.randint(0, 127)) for _ in range(length))
length = 10000
s1 = constant_string(length)
s2 = random_string(length)
for s in [s1, s2]:
def test():
arr = [s[i:] for i in range(len(s))]
random.shuffle(arr)
arr.sort()
print(timeit.timeit(test, number=100))
在我的计算机上,常量字符串测试大约需要两倍的时间,因为这两个版本都对包含相同大小值的随机数组进行排序。
关于python - CPython 中的字符串排序是如何优化的?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44866493/
如果您使用 -i 选项调用 cpython 解释器,它会在完成任何命令或脚本后进入交互模式。有没有办法在程序中让解释器执行此操作,即使它没有给出 -i?明显的用例是在异常情况发生时通过交互式检查状态进
我是按照官方cpython代码link here上的说明操作的.我做了一个 hg update 3.5 然后做了以下。 sudo apt-get build-dep python3.5 但它抛出了一个
我打算尝试使用 PyPy。但是我用 rust-cpython 编写的扩展(.so 文件)在使用 pypy3 执行时无法加载: ImportError: No module named 'pkg.lib
我试图配置预提交挂接,在运行预提交运行--所有文件时,我收到以下错误:。我已尝试升级pip以解决此问题pip安装--升级pip,但我收到另一个错误:。我尝试检查PIP和PIP3的版本,但现在我也收到了
我想为 android 创建电影下载应用程序以供学习。 为了方便开发,我想使用 youtube-dl 作为下载器后端。 所以我想将 Cpython 运行时和 ffmpeg(用于转换电影格式)嵌入到 A
我有一个 Windows fatal exception: code 0xc0000374 - 是的,有多处理(等待但是......)。 Google 表示异常代码 0xc0000374 表示堆损坏。
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我刚刚成功编译了 C++ 类的 Python 包装器。但是,当我尝试将模块加载到 Python 时(通过 import cell),我收到以下消息: ImportError: dynamic modu
在我用 python 函数包装的一个 C++ 源文件中,有人包含了以下内容: namespace some_namespace { static double some_double; } flo
例如,0 STORE_NAME 0 (sys) 是import sys 指令的一部分。这种指令格式有任何文档吗?更何况,这种格式是Python的标准吗?还是具体实现? 最佳答案 即Python byt
我有这个故意不高效的代码: def suffix_array_alternative_naive(s): return [rank for suffix, rank in sorted((s[
应该如何编写 CPython 扩展,以便 pydoc 提及参数名称而不是 (...)? 我关注了 official python tutorial about extending Python ,甚至
我正在尝试在运行 Raspbian Jessie 的 Raspberry Pi 上从源代码构建和安装 python 3.6.2。以下是构建过程的过程: $ ./configure --enable-o
GAE 有各种限制,其中之一是最大的可分配内存块大小为 1Mb(现在是 10 倍,但这并没有改变问题)。这一限制意味着不能在 list() 中放置超过一定数量的项目,因为 CPython 会尝试为元素
我和一个 friend 聊天,比较语言,他提到 Java 的自动内存管理优于 Python,因为 Java 有压缩,而 Python 没有——因此对于长时间运行的服务器,Python 是一个糟糕的选择
我一直在深入研究源代码,以找出打印结果的时间点。例如: >>> x = 1 >>> x + 2 3 以上两条语句编译为: 1 0 LOAD_CONST
我最近在生产系统中发现了一个潜在的错误,其中两个字符串使用身份运算符进行比较,例如: if val[2] is not 's': 我想这无论如何都会经常起作用,因为据我所知,CPython 将短的不可
Python 允许字符串乘以整数: >>> 'hello' * 5 'hellohellohellohellohello' 这是如何在 CPython 中实现的? 我特别感谢指向源代码的指针; the
我正在阅读 this page在文档中,并注意到它说 This is the full Python grammar, as it is read by the parser generator an
我目前正在制作 CPython 3.0 Python 解释器的嵌入式系统端口,我对任何引用资料或文档特别感兴趣,这些引用资料或文档提供有关版本 3.0 的代码设计和结构的详细信息,甚至是任何2.x 版
我是一名优秀的程序员,十分优秀!