python - 什么时候会使用递归合并排序而不是迭代？-6ren

python - 什么时候会使用递归合并排序而不是迭代？

转载作者：行者123 更新时间：2023-12-02 17:57:52

25

4

是否存在应该使用递归合并排序而不是迭代合并排序的情况？最初，我认为合并排序的迭代方法通常更快，尽管我无法在自己的实现中证明这一点。但是递归会对堆栈进行更多的调用，这反过来又降低了内存效率。如果我有一个非常大的数据集需要排序怎么办？那么使用递归不是很糟糕吗？因为过度深度的递归最终不会导致堆栈溢出吗？如果递归速度较慢且内存效率较低，为什么还要使用递归而不是迭代？

def merge_sort(arr):
    if len(arr) <= 1:
        return arr

    current_size = 1
    while current_size < len(arr):
        left = 0
        while left < len(arr)-1:
            mid = left + current_size - 1
            right = min((left + 2*current_size - 1), (len(arr)-1))
            merged_arr = merge(arr[left : mid + 1], arr[mid + 1 : right + 1])
            for i in range(left, right + 1):
                arr[i] = merged_arr[i - left]
            left = left + current_size*2
        current_size = current_size * 2
    return arr

def merge(left, right):
    result = []
    i = 0
    j = 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result += left[i:]
    result += right[j:]
    return result

def merge_sort_recursive(arr):
    if len(arr) <= 1:
        return arr
    mid = len(arr) // 2
    left = arr[:mid]
    right = arr[mid:]
    left = merge_sort_recursive(left)
    right = merge_sort_recursive(right)
    return merge(left, right)

def merge(left, right):
    result = []
    i = 0
    j = 0
    while i < len(left) and j < len(right):
        if left[i] < right[j]:
            result.append(left[i])
            i += 1
        else:
            result.append(right[j])
            j += 1
    result += left[i:]
    result += right[j:]
    return result

最佳答案

更新嗯，在编写了我自己的更简单的迭代之后，我必须收回我写的一些内容......

def merge_sort_Kelly(arr):
    half = 1
    while half < len(arr):
        for mid in range(half, len(arr), 2*half):
            start = mid - half
            stop = mid + half
            arr[start:stop] = merge(arr[start:mid], arr[mid:stop])
        half *= 2
    return arr

对三个洗牌排序的时间list(range(2**17)) (Try it online!):

1.35 seconds merge_sort
0.91 seconds merge_sort_recursive
0.90 seconds merge_sort_Kelly

1.25 seconds merge_sort
1.05 seconds merge_sort_recursive
0.92 seconds merge_sort_Kelly

1.34 seconds merge_sort
0.81 seconds merge_sort_recursive
0.88 seconds merge_sort_Kelly

它几乎和递归一样快，而且我想说几乎和递归一样简单。甚至是 end 的边界检查毕竟是不必要的，因为 Python 切片为我处理了这个问题。不平衡问题依然存在。

关于内存效率:实际上，您的迭代比递归占用更多内存，而不是更少。以下是 list(range(2**17)) 排序期间的分配峰值用 tracemalloc 测量(Try it online!):

3,342,704 bytes  merge_sort
2,892,479 bytes  merge_sort_recursive
2,752,720 bytes  merge_sort_Kelly
  525,572 bytes  merge_sort_Kelly2 (see text below)

在最终/顶级合并期间达到峰值。您的迭代需要更多时间，因为在计算最终的 merged_arr 时，该变量仍然保留前一个变量。可以通过 del merged_arr 来避免当不再需要它时。那么只需要 2,752,832 字节。当然，如果我们不制作这么多切片副本而是使用索引，那么我们所有的解决方案都可以占用更少的内存。这就是merge_sort_Kelly2做。它只复制其合并函数，并且只复制一半，然后将原始列表中的一半和另一半合并到原始列表中。

更新结束，原始答案:

Why would you ever use recursive over iterative

主要是因为它更简单/更好。例如，您的递归可以对 [3, 1, 4] 进行排序而您的迭代崩溃并显示 IndexError 。毫无疑问，因为它更复杂。

递归也更加平衡，需要更少的比较。左侧和右侧始终相等或仅相差一个元素。例如，对于 arr = list(range(2**17)) ，两者都进行了 1114112 次比较，因为两者同样完美平衡。但随着2**17+1 ，迭代进行了 1245184 次比较，而递归则只进行了 1114113 次比较。因为迭代最后将 2^17 个元素与 1 个元素合并(并且该元素恰好是最大的)。

I timed these two implementations and found iterative does in fact appear to be faster.

我的看法恰恰相反。即使对于 2^17 个元素，迭代也不会出现不平衡问题。对三个列表进行双向排序所需的时间:

1.23 seconds merge_sort
0.83 seconds merge_sort_recursive

1.25 seconds merge_sort
0.82 seconds merge_sort_recursive

1.19 seconds merge_sort
0.80 seconds merge_sort_recursive

代码:

from random import shuffle
from time import time

for _ in range(3):
    arr = list(range(2**17))
    shuffle(arr)
    for sort in merge_sort, merge_sort_recursive:
        copy = arr[:]
        t0 = time()
        copy = sort(copy)
        print(f'{time()-t0:.2f} seconds {sort.__name__}')
        assert copy == sorted(arr)
    print()

关于python - 什么时候会使用递归合并排序而不是迭代？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/75229164/

25

4

0

文章推荐： TypeScript - 从具有特定类型的所有属性中获取类型

文章推荐： python - 合并两个字典列表，忽略 None 条目

文章推荐： c++ - 具有非类型模板参数的别名模板

文章推荐： excel - 多列合并为一列，以逗号分隔

list - 合并(合并)不同长度的向量
我有几个长度不等的 vector ，我想对其进行cbind。我将 vector 放入列表中，并尝试结合使用do.call(cbind, ...): nm <- list(1:8, 3:8, 1:5)
java - 合并(合并)2 个 JSONObjects 的最佳方式是什么？
合并(合并)两个 JSONObjects 的最佳方式是什么？ JSONObject o1 = { "one": "1", "two": "2", "three": "3" }
c# - 合并(合并？)并简化/减少 GeoJson 的 DbGeometry 记录
我在一个表中有许多空间实体，其中有一个名为 Boundaries 的 geometry 字段。我想生成一个具有简化形状/几何图形的 GeoJson 文件。这是我的第一次尝试: var entitie
postgresql 合并
谁能说出为什么这个选择返回 3.0 而不是 3.5: SELECT coalesce(1.0*(7/2),0) as foo 这个返回 3: SELECT coalesce(7/2,0) as foo
XSLT 合并/合并节点
首先抱歉，也许这个问题已经提出，但我找不到任何可以帮助我的东西，可能是因为我对 XSLT 缺乏了解。我有以下 XML: 0 OK
svn - 追溯复制/合并
有时用户会使用 Windows 资源管理器复制文件并在他们应该执行 svn 存储库级别的复制或合并时提交它们。因此，SVN 没有正确跟踪这些变化。一旦我发现这一点，损坏显然已经完成，并且可能已经对相关
excel - 合并/堆叠没有VBA的excel列范围定义
我想组合/堆叠 2 个不同列的值并获得唯一值。如果范围相邻，则可以正常工作。例如: =UNIQUE(FILTERXML(""&SUBSTITUTE(TEXTJOIN(",",TRUE,TRANSPO
.net - 如何使用iTextSharp将PDF与可填写的表单字段合并/合并？
使用iTextSharp，如何将多个PDF合并为一个PDF，而又不丢失每个PDF中的“表单字段”及其属性？ (我希望有一个使用来自数据库的流的示例，但文件系统也可以) 我发现this code可以正常
r - 合并/加入优先考虑非缺失值
是否有一个合并函数可以优先考虑公共(public)变量中的非缺失值？考虑以下示例。首先，我们生成两个 data.frames，它们具有相同的 ID，但在特定变量上有互补的缺失值: set.seed
tfs - 合并/分支策略
我们正在尝试实现 ALM Rangers 在最新的 Visual Studio TFS Branching and Merging Guide 中描述的“基本双分支计划”。 .从指导: The bas
file - 合并/附加文件并在unix中重新编号第一列
我在不同目录(3个不同名称)中有很多(3个只是一个例子)文本文件，如下所示: 目录:A，文件名:run.txt 格式:txt制表符分隔 ; file one 10 0.2 0.5 0.
sql - “合并”样式操作与文字值？
我有一张包含学生等级关系的表： Student Grade StartDate EndDate 1 1 09/01/2009 NULL 2
Symfony2 Doctrine 合并
我在学习 https://www.doctrine-project.org/projects/doctrine-orm/en/2.6/reference/working-with-associatio
移动的源代码文件的 SVN 合并
我觉得我有世界上最简单的 SVN 用例: 我有一个文件，Test.java在 trunk SVN的。我分行trunk至 dev-branch . 我搬家Test.java进入 com/mycompa
r - 合并/合并具有相同名称但数据不完整的列
我有两个数据框，其中一些列名称相同，而另一些列名称不同。数据框看起来像这样: df1 ID hello world hockey soccer 1 1 NA NA
elasticsearch - 合并/展平子aggs到主agg
Elasticsearch 中是否缺少以扁平化形式(多个子/子aggs)返回结果的方法？例如，当前我正在尝试获取所有产品类型及其状态(在线/离线)。这就是我最终得到的: aggs [ { key:
Scala:合并 map
如何合并如下所示的 map : Map1 = Map(1 -> Class1(1), 2 -> Class1(2)) Map2 = Map(2 -> Class2(1), 3 -> Class2(2)
hadoop - 执行sqoop时发生错误-合并
我试图通过从netezza服务器导入数据来合并两个数据集。以下是数据集，其数字为，ID为，字母为，名称为: 下表都是使用命令从netezza导入的: sqoop import --connect n
php - 合并、输出两个数组的项目并突出显示各自的项目
我有两个数组 $array1 = array('first', 'second', 'third', 'fourth'); $array2 = array('first', 'third', 'fou
sql - 合并 - 仅在值发生更改时更新
我正在 SQL Server 中运行合并。在我的更新中，我只想在值发生更改时更新该行。有一个版本行在每次更新时都会递增。下面是一个例子: MERGE Employee as tgt USING (SE

首页

博学

6Ren·AI

商城

python - 什么时候会使用递归合并排序而不是迭代？