algorithm - 为什么合并排序优先于快速排序来排序链表-6ren

algorithm - 为什么合并排序优先于快速排序来排序链表

转载作者：塔克拉玛干更新时间：2023-11-03 02:12:27

26

4

我在论坛上读到以下内容:

Merge sort is very efficient for immutable datastructures like linked lists

和

Quick sort is typically faster than merge sort when the data is stored in memory. However, when the data set is huge and is stored on external devices such as a hard drive, merge sort is the clear winner in terms of speed. It minimizes the expensive reads of the external drive

和

when operating on linked lists, merge sort only requires a small constant amount of auxiliary storage

谁能帮我理解上面的论点？为什么合并排序优先用于排序巨大的链表？以及它如何最大限度地减少对外部驱动器的昂贵读取？基本上我想了解为什么人们会选择归并排序来对大链表进行排序。

最佳答案

快速排序非常适合就地排序。特别是，大多数操作都可以根据交换数组中的元素对来定义。然而，要做到这一点，您通常使用两个指针(或索引等)“遍历”数组。一个从数组的开头开始，另一个从数组的结尾开始。然后两者都向中间移动(当它们相遇时你就完成了一个特定的分区步骤)。这对于文件来说是昂贵的，因为文件主要面向一个方向的阅读，从头到尾。从末尾开始向后寻找通常成本相对较高。

至少在其最简单的体现中，归并排序几乎是相反的。实现它的简单方法只需要从一个方向查看数据，但是涉及将数据分成两个独立的部分，对这些部分进行排序，然后将它们合并回一起。

使用链表，很容易在一个链表中获取(例如)交替元素，并操纵链接以从这些相同元素创建两个链表。对于数组，如果您愿意创建与原始数据一样大的副本，则重新排列元素以便交替元素进入单独的数组很容易，但在其他方面则更重要。

同样，如果您将源数组中的元素按顺序合并到一个包含数据的新数组中，则与数组的合并会很容易——但是在不创建数据的全新副本的情况下就地进行合并是一个完全不同的故事。使用链接列表，将两个源列表中的元素合并到一个目标列表中是微不足道的——同样，您只需操作链接，而无需复制元素。

至于使用 Quicksort 为外部合并排序生成已排序的运行，它确实有效，但它通常(肯定)不是最优的。要优化合并排序，您通常希望在生成时最大化每个排序“运行”的长度。如果您只是读入适合内存的数据，对其进行快速排序并将其写出，则每次运行将被限制为(略小于)可用内存的大小。

不过，通常情况下，您可以做得更好。您从读取一个数据 block 开始，但不是在其上使用快速排序，而是构建一个堆。然后，当您将每个项目从堆中写出到排序的“运行”文件中时，您从输入文件中读取了另一个 项目。如果它比您刚写入磁盘的项目大，则将其插入现有堆中，然后重复。

较小的项目(即属于已写入项目之前的项目)保持分开，并构建到第二个堆中。当(且仅当)您的第一个堆为空，并且第二个堆已接管所有内存时，您停止将项目写入现有的“运行”文件，并开始一个新的。

具体效果如何取决于数据的初始顺序。在最坏的情况下(输入以相反的顺序排序)它根本没有用。在最好的情况下(输入已经排序)，它可以让您在一次输入中“排序”数据。在一般情况下(以随机顺序输入)，它可以让您将每次排序运行的长度大约增加一倍，这通常会将速度提高大约 20-25%(尽管百分比会根据大多少而有所不同)你的数据比可用内存小)。

关于algorithm - 为什么合并排序优先于快速排序来排序链表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/5222730/

26

4

0

文章推荐： string - 查找具有相似文本的文章的算法

文章推荐： c# - .NET 或 C++ 中的 Erlang 风格并发

文章推荐： algorithm - 已知统计分布数据的排序算法？

数据结构-链表
今天我们将开始第二个数据类型-链表的学习，同样我们还是用最原始的方式，自己申请内存管理内存来实现一个链表。 01、01、定义什么是链表？链表在物理存储结构上表现为非顺序性和非连续性，因此链表
Java数据结构与算法学习笔记【链表】
前言：笔记是参考B站up主尚硅谷，图片、代码都是哦。在blog写笔记~（图片、代码来源尚硅谷，侵权必删！）尚硅谷数据结构学习路线B站网站：https://www.bilibili.com/video
C——链表
这个问题不太可能对任何 future 的访客有帮助；它只与一个较小的地理区域、一个特定的时间点或一个非常狭窄的情况相关，通常不适用于全世界的互联网受众。如需帮助使此问题更广泛适用，visit the
复制指向函数中结构体的指针(链表)
我想创建一个没有全局变量的单个链表。我用 NULL 初始化了第一个元素，然后想将第一个元素 node 复制到 list_。它被复制到函数中，但副作用不起作用。在我的主函数中，该值仍然是NULL。如果我
C++链表
我正在尝试使链表与此处的链表相似: linked list in C 那就是在另一个结构中有“头”，我首先称它为“头”。但是我发现做那个改变。很难向 list_item 结构添加值。我已经尝试了一些东
C - 链表
我正在尝试理解链表的代码。我明白他们是如何工作的。我正在查看一些与动态内存和链表有关的代码，我在此处对其进行了简化: #include #include typedef struct nod
C语言与队列/链表
有人可以解释下面的代码吗？我是 C 的新手，正在努力弄清楚。为什么我们最后有 queueNodeT？ typedef char queueElementT; typedef struct queueN
算法题..链表
场景如下:- 我想反转单链表的方向，换句话说，反转后所有指针现在应该指向后.. 这个算法应该需要线性时间。我想到的解决方案是使用另一个数据结构 A Stack.. 借助它可以轻松反转单向链表，所有指
Python 链表
在 python 中使用链表最简单的方法是什么？在 scheme 中，链表由 '(1 2 3 4 5) 定义。 Python 的列表 [1, 2, 3, 4, 5] 和元组 (1, 2, 3, 4,
图解LeetCode算法汇总——链表
本文首发公众号：小码A梦一般数据主要存储的形式主要有两种，一种是数组，一种是链表。数组是用来存储固定大小的同类型元素，存储在内存中是一片连续的空间。而链表就不同于数组。链表
arrays - 链表、数组和硬件内存缓存
虽然之前有人问过关于链表与数组的问题，但答案大多归结为我们大多数人在某个时候可能已经学到的东西: 列表擅长插入和删除数组擅长随机访问现在像 Bjarne Stroustrup 这样受人尊敬的人有
c - 链表。在哪里分配以及如何应对碎片化？
位置在堆中，碎片化(每个节点的 malloc) - 在几种不同的方式(缓慢分配，缓慢访问，内存碎片)方面效率低下在堆中，在一个大块中 - 当需要重新分配时，数据结构获得的所有灵活性都将丢失在堆
Java 泛型，链表
我完成了泛型的学习，但并不容易。不过，我确实明白了。这是我的理解。我希望您纠正我的错误并回答几个问题:)。 public class LinkedList { //class definition }
ocaml - 链表 OCaml
我将如何创建一个链接列表来在 OCaml 中保存我的数据？我正在尝试制作一个单链表，但是我遇到了语法问题。我只想制作一个模块来简单地从链表中获取'a，插入'a或删除'a。有人知道吗？最佳答案正如
C编程，动态分配+链表
我在使用这段代码时遇到了问题，我不确定我做错了什么 #include #include #include #include typedef struct flight_struct{
javascript - 链表 - 删除最后一个节点
我正在创建一个函数来删除给定列表的最后一个节点(作为参数输入)。该函数本身非常简单，如下所示。 function popBack(list) { var current = list.head
java - 链表 - 在当前节点之前插入一个节点
我正在尝试开发一种方法，该方法将在链接列表中的当前节点之前插入传递给它的节点。它有3个条件。对于此实现，不能有任何头节点(仅对列表中第一个节点的引用)，并且我无法添加更多变量。如果列表为空，则将传递
Scala 链表 stackoverflow
使用 scala，我已将大约 100000 个节点添加到链表中。当我使用函数 length 时，例如 mylist.length。我收到“java.lang.StackOverflowError”错误
java - 递归地添加节点项。链表
所以我正在学习处理链表。我将如何递归地添加节点内的项目。我可以通过执行 sum = h.item +h.next.item+h.next.next.item 添加它们，但这只有在我有小的链接列表时才有
C 链表/-> 运算符
所以我一直在努力理解链表的概念(一直在看一些示例代码，我在互联网上找到了这个。现在如果我能请别人确认我是否正确掌握了一些概念。我将绘制图表，说明我认为每个代码链接的作用。 #include #inc

首页

博学

6Ren·AI

商城

algorithm - 为什么合并排序优先于快速排序来排序链表