python - 使用 heapify 与 heappush 创建堆。哪个更快？-6ren

python - 使用 heapify 与 heappush 创建堆。哪个更快？

转载作者：太空宇宙更新时间：2023-11-03 12:03:04

28

4

问题

我必须创建一个优先级队列来存储距离。为了构建堆，我正在考虑以下两种可能性:

from heapq import heapify, heappush
n = 35000  # input size

# way A: using heapify
dist = []
for i in range(n):
  dist.push(distance)  # distance is computed in O(1) time
heapify(dist)

# way B: using heappush
dist = []
for i in range(n):
  heappush(dist, distance)  # distance is computed in O(1) time

哪个更快？

推理

根据文档，heapify() 以线性时间运行，我猜 heappush() 以 O(log n) 时间运行。因此，每种方式的运行时间为:

A: O(2n) = O(n)
B: O(n log n)

但是，A 比 B 快对我来说是违反直觉的。我是不是漏掉了什么？ A真的比B快吗？

**编辑

我一直在测试不同的输入和不同大小的数组，但我仍然不确定哪个更快。

在阅读了 Elisha 的评论链接后，我明白了 heapify() 是如何在线性时间内运行的。但是，我仍然不知道使用 heappush() 是否会更快，具体取决于输入。

我的意思是，heappush() 的最坏情况 运行时间为 O(log n)，但平均而言可能更短，具体取决于输入。它的最佳情况运行时间实际上是 O(1)。另一方面，heapify() 的最佳情况 运行时间为 O(n)，并且必须在填充数组后调用，这也需要 O(n)。这是 O(2n) 的最佳情况。

因此 heappush() 可能与线性一样快或与 O(n log n) 一样慢，而 heapify() 将花费 2n 任何情况下的时间。如果我们看最坏的情况，heapify() 会更好。但是一般情况呢？

我们甚至可以确定其中一个比另一个更快吗？

最佳答案

是的，我们可以确定一个比另一个快。

heap.push 从下往上构建堆。每个项目都被添加到数组的末尾，然后“冒泡”到它的正确位置。如果您正在构建一个最小堆并且您以相反的顺序显示项目，那么您插入的每个项目都需要进行 log(n)(n 是堆的当前大小)比较。所以通过插入建堆的最坏情况是O(n log n)。

想象一下，从一个空堆开始，并以相反的顺序添加 127 个项目(即 127、126、125、124 等)。每个新项目都小于所有其他项目，因此每个项目都需要最大数量的交换才能从最后一个位置冒泡到顶部。添加的第一个项目进行零交换。接下来的两个项目各进行一次交换。接下来的四个项目每个进行两次交换。八个项目进行三个交换。 16 个项目进行四次交换。 32 项进行 5 次交换，64 项进行 6 次交换。计算结果为:

0 + 2*1 + 4*2 + 8*3 + 16*4 + 32*5 + 64*6
0 + 2 + 8 + 24 + 64 + 160 + 384 = 642 swaps

build-heap 的最坏情况是 n 次交换。考虑同样包含 127 个项目的数组。叶级包含 64 个节点。 build-heap 从中间点开始，向后移动，根据需要向下移动。倒数第二层有 32 个节点，最坏情况下它们会下移一层。上一层有 16 个节点，不能向下移动超过两层。如果你把它加起来，你会得到:

64*0 + 32*1 + 16*2 + 8*3 + 4*4 + 2*5 + 1*6
0 + 32 + 32 + 24 + 16 + 10 + 6 = 120 swaps

这绝对是 build-heap 的最坏情况。是 O(n)。

如果您在一个包含一百万个项目的数组上分析这两种算法，您会发现运行时间存在巨大差异，build-heap 要快得多。

关于python - 使用 heapify 与 heappush 创建堆。哪个更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/42186788/

28

4

0

文章推荐：对于单个 Unicode 字符串，Python 返回长度为 2

文章推荐： c# - NLog 列出 Logger 上的属性值

文章推荐： python - 避免pylints广泛的通用方法除外？

python - 如何在保留列表的同时通过某个索引从矩阵中 heappush 列表？
假设我有一个列表: l1 = [[1, 3], [3, 2], [2, 1]] 我想将 l1 中的每个项目推送到二进制堆，“内存”，但在二进制堆中按 each_item[-1] 排序。我试过:hea
Python heapq heappush 多元素数组真值不明确使用 a.any() 或 a.all()
我遇到了 heapq 库的错误——尤其是 heappush 函数。错误代码(下方)对我没有任何帮助。 (Pdb) heapq.heappush(priority_queue, (f, depth, c
python - heapify 和 heappush 有什么区别？哪个更好？
heapify 和 heapush 都将最小的项目放在顶部，最低的项目位于正确的位置。我不明白有什么区别和用法差异 import heapq H = [21,1,45,78,3,5] # Covert
python - 使用 heapify 与 heappush 创建堆。哪个更快？
问题我必须创建一个优先级队列来存储距离。为了构建堆，我正在考虑以下两种可能性: from heapq import heapify, heappush n = 35000 # input size
python - 为什么使用 heapq.heapify 创建的堆与迭代 heapq.heappush 创建的堆不同
我注意到给定一个列表，如果我使用 heapq.heapify() 创建一个堆，元素的顺序与我在列表上迭代并执行 heap.heappush() 时获得的顺序不同。谁能帮我理解为什么？此外，对于可迭
python-3.x - heapq.heappushpop 如何比 python 中的 heappop 和 heappush 更高效
在 heapq 的文档中，它写道 heapq.heappushpop(heap, item) Push item on the heap, then pop and return the smalle

首页

博学

6Ren·AI

商城

python - 使用 heapify 与 heappush 创建堆。哪个更快？

问题

推理

**编辑