c# - 为什么在 MergeSort 中使用 InsertionSort 而不是 Merge 平均速度更快？-6ren

c# - 为什么在 MergeSort 中使用 InsertionSort 而不是 Merge 平均速度更快？

转载作者：塔克拉玛干更新时间：2023-11-03 06:28:43

24

4

最近，我着迷于 ShellSort 算法思想，简单地在小子列表中使用 InsertionSort，然后最后对整个列表使用 InsertionSort。

所以，我想为什么不将 MergeSort 与 InsertionSort 结合使用(而不是使用 Merge() 函数，而是使用 InsertionSort)。由于 InsertionSort 擅长对部分排序的列表进行排序，而 MergeSort 的思想是将两个排序的列表合并为一个排序的列表。

然后，我测试了使用 merge() 函数的 MergeSort 和仅使用 InsertionSort() 的 MergeSort，其中包含 10,000,000 个具有随机值的元素的数组。事实证明，使用 InsertionSort() 的 MergeSort 执行速度比使用 merge() 函数的 MergeSort 快几倍。由于想出准确的数学证明超出了我的能力，所以我来这里是为了寻求逻辑上的原因。以下是我要确认的内容:

对于更大的数组，使用 merge() 函数的 MergeSort 的平均性能是否会优于使用 InsertionSort() 的 MergeSort，反之亦然？
也许我的 MergeSort with merge() 函数效率低下。
在 MergeSort 中使用 ShellSort 而不是 InsertionSort 会产生更快的性能吗？
既然 MergeSort 和 InsertionSort 不是一个坏主意，我相信已经有人发现了它。我想知道它是否有任何独特的算法名称。

下面是MergeSort()的实现

public static void MergeSort(int[] array)
{
    int[] aux = new int[array.Length];
    MergeSort(array, aux, 0, array.Length - 1);
}

public static void MergeSort(int[] array, int[] aux, int low, int high) 
{
    if (low >= high) return;

    int mid = (low + high) / 2;

    MergeSort(array, aux, low, mid);
    MergeSort(array, aux, mid + 1, high);

    Merge(array, aux, low, mid, high);
}

protected static void Merge(int[] array, int[] aux, int low, int mid, int high) {
    // copy into aux array
    for (int i = low; i <= high; i++) aux[i] = array[i];

    // merge
    int j = low, k = mid + 1;
    for (int o = low; o <= high; o++) {
        if (j > mid)
            array[o] = aux[k++];
        else if (k > high)
            array[o] = aux[j++];
        else if (aux[k] < aux[j])
            array[o] = aux[k++];
        else
            array[o] = aux[j++];
    }
}

下面是MergeSort with InsertionSort()

public static void MergeInsertionSort(int[] array) 
{
    MergeInsertionSort(array, 0, array.Length - 1);
}

public static void MergeInsertionSort(int[] array, int low, int high) 
{
    if (low >= high) return;
    if (low + 1 == high) {
        // sort two elements
        if (array[low] > array[high]) {
            int tmp = array[low];
            array[low] = array[high];
            array[high] = tmp;
        }
    } else {
        int mid = (low + high) / 2;

        MergeInsertionSort(array, low, mid);
        MergeInsertionSort(array, mid + 1, high);

        // do insertion sort
        for (int i = mid + 1, j; i <= high; i++) {
            int ins = array[low];

            // move the element into correct position
            for (j = i - 1; (j >= low) && (ins < array[j]); j--) {
                array[j + 1] = array[j];
            }

            array[j + 1] = ins;
        }
    }
}

以下为可运行代码，您可以在您的电脑上进行测试: http://pastebin.com/4nh7L3H9

最佳答案

您根本不是在测试同一件事。您的 Merge 方法使用辅助数组，它所做的第一件事是在执行实际合并工作之前将初始数组复制到辅助数组。因此，每次调用 Merge 时，您最终都会做两倍的工作。

您可以通过对 array 和 aux 进行一些智能交换来消除该额外副本。这在非递归实现中更容易处理，但在递归版本中是可能的。我会把它留作练习。

您的 MergeInsertionSort 方法的运行方式大不相同。它根本没有进行合并。它只是拆分数组并在越来越大的范围内进行插入排序。

思路是使用插入排序，以便在范围较小时减少merge的开销。通常它看起来像这样:

public static void MergeSort(int[] array, int[] aux, int low, int high) 
{
    if (low >= high) return;

    if ((high - low) < MergeThreshold)
    {
        // do insertion sort of the range here
    }
    else
    {
        int mid = (low + high) / 2;

        MergeSort(array, aux, low, mid);
        MergeSort(array, aux, mid + 1, high);

        Merge(array, aux, low, mid, high);
    }
}

然后将 MergeThreshold 设置为您确定合适的“小范围”值。通常它在 5 到 20 的范围内，但您可能想要尝试不同的值和不同的类型(整数、字符串、复杂对象等)以获得一个好的综合数字。

关于c# - 为什么在 MergeSort 中使用 InsertionSort 而不是 Merge 平均速度更快？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20886540/

24

4

0

文章推荐： algorithm - 查找关键比较数 C 和移动数 M

文章推荐： c++ - 从另一组整数中高效移除一组整数

文章推荐： python - 使用 Python 查找最长递增子序列的迭代解决方案

文章推荐：递归函数中的 Python 参数

java - 为什么递归 MergeSort 比迭代 MergeSort 更快？
我刚刚实现了这两种算法，当我绘制结果时我很惊讶!递归实现显然比迭代实现更快。之后，我将插入排序与两者相结合，结果是一样的。在讲座中，我们经常看到递归比阶乘计算中的迭代慢，但在这里似乎并非如此。我很确
mergesort - 归并排序的稳定性
很难说出这里问的是什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或言辞激烈，无法以目前的形式合理回答。如需帮助澄清此问题以便可以重新打开，visit the help center . 8年前关闭
java - 调试 : Mergesort
尝试在 Java 中实现归并排序。我在脑海中仔细检查了我的代码，我觉得它应该可以工作，但显然我做错了什么。这是代码 public static void mergeSort(int[] inp
c - Mergesort 实现中的段错误
我有一个程序 Mergesort 与无序列表一起工作。我得到的问题是段错误(核心转储)。实际上，我经常收到此错误，但我不知道如何解决。此外，它不会显示任何错误或警告消息来查找它。在这个源代码和其他一
使用多线程加速 Java MergeSort
我正在尝试使用多线程实现合并排序的版本。首先，我知道这里有十亿条线索(给予或接受......)，而我读了一些但无济于事!我试图证明并行使用线程可以加快进程的速度。然而，我遇到的问题是我的代码没有显示和
java - Mergesort 数组索引越界异常
package merge; public class Merger { int[] a = {1, 10, 5, 9}; // int[] a = {1, 10, 5, 9, 8, 6, 3,
c++ - Mergesort:动态分配大小仅在运行时已知的数组
我正在上算法课，并试图在 C++ 中实现合并排序。我试图存储左右子数组，但意识到我无法这样做，因为我无法在运行时初始化大小。有没有办法解决这个问题，或者我是否错误地进行了排序过程？我在下面列出了我所拥
java - 只想打印一次数组 - MergeSort
遇到合并排序问题。对数组进行排序后，我希望它只打印完全排序的数组，而不是每次传递。我的代码如下。我在数组似乎已排序后运行 printArray(intArray) 。也许我把它放在错误的地方？您可以在
java - mergeSort ArrayIndexOutOfBoundsExecption
练习合并排序时遇到问题。我在线程“main”java.lang.ArrayIndexOutOfBoundsException 中收到异常:1mergeSort 部分工作得很好，但重新组装数组对我来说很
java - MergeSort - 实现
在多次递归调用后，low 变为等于 high，递归中断。之后会发生什么？谁能解释一下。合并过程对我来说很清楚:当调用 mergesort(0,5) 时，它会再次调用自身:mergesort(0,2)
c - MergeSort - 编译但不给出任何输出
这是基于 Cormen 书中给出的算法。我做错了什么？ #include #include void mergesort(int a[],int,int); void merge(int a[],
c - Mergesort，使用for循环做合并
我正在尝试在合并函数中使用 for 循环为 mergesort 编写 C 代码。不幸的是它不工作。在 main 函数中，我按降序在 10 个 int 上创建了一个 array，然后调用 mergeso
c - Mergesort - 段错误
代码目录结构， ./Computing$ ls -LR .: list file.txt mergeSort.c program.exe type.h ./list: arrayImpl.c l
Python:MergeSort 数据输入
我想制作一个 MergeSort 算法，我想从外部文件(如 txt)获取我的数据，当我导入我的文件时，我得到一些奇怪的结果 [9. 9. 9. 9.] 我的输入数据是 [12, 44, 11, 9]
java - MergeSort 不稳定
我一直在尝试实现我的“自己的”MergeSort，它似乎适用于较小的值，但我正在以随机顺序在 1-100,000 的数组上尝试它，并在打印时混合了一些奇怪的数字退出。我已经跟踪了 10 次，但都没有运
java - Mergesort 实现不正确
我一直在尝试编写一个基本的自上而下的归并排序，但代码执行完毕后数组并未完全排序。我试过调试它，但所有的递归使得很难查明。我也曾尝试将我的代码与其他合并排序示例进行比较，但我没有找到任何差异 p
Python - MergeSort 递归错误
我在 python 中使用递归编写了一个 MergeSort 程序，但我不断收到有关第 27 行、第 23 行、第 18 行和递归错误的错误: “RecursionError:比较时超出了最大递归深度
c - Mergesort 在执行时为已排序数组的第一个元素提供垃圾值
我正在使用“算法简介”中描述的算法实现 Mergesort。但是，在每次执行时，我都会得到一个垃圾值作为排序数组的第一个元素。这是它的代码: #include #include #include
algorithm - Mergesort:合并操作的最后一步是怎么回事？
以下合并排序来自数据结构和算法分析 (Weiss)。我想知道的是合并步骤中的最后一个 for 循环。我知道我们必须将 tmpArray 复制回 array，但我不明白为什么我们从 rightend 开
java - 将堆栈用于非递归 MergeSort？
我的教授分配了一个问题，我们必须使用堆栈(或队列)来进行非递归 MergeSort。目前代码如下: private static void sort(Comparable[] a, int[] in

首页

博学

6Ren·AI

商城

c# - 为什么在 MergeSort 中使用 InsertionSort 而不是 Merge 平均速度更快？