algorithm - TimSort minRun 选择。为什么完美平衡的合并比不平衡的合并更受欢迎？-6ren

algorithm - TimSort minRun 选择。为什么完美平衡的合并比不平衡的合并更受欢迎？

转载作者：行者123 更新时间：2023-12-04 17:15:15

26

4

在 TimRun document 的“计算最小运行”部分，它给出了为 N=2112 数组选择 minrun 的好坏示例。它指出使用 minrun = 32 是低效的，因为

runs of lengths 2048 and 64 to merge at the end The adaptive gimmicks can do that with fewer than 2048+64 compares, but it's still more compares than necessary, and-- mergesort's bugaboo relative to samplesort --a lot more data movement (O(N) copies just to get 64 elements into place).

它还将 minrun = 32 算法描述为:

then we've got a case similar to "2112", againleaving too little work for the last merge to do

然后它说选择 minrun = 33 最终会得到一个更好的完美平衡的合并。

If we take minrun=33 in this case, then we're very likely to end up with 64runs each of length 33, and then all merges are perfectly balanced. Better!

我的问题是，如果总元素数相同(示例中为 2112)，为什么合并完美平衡的排序数组比不平衡数组更好？
当 minrun=33 的总元素也是 2112 时，为什么 minrun=32 “做比必要的更多的比较”？
为什么会有“更多的数据移动”？
为什么最后一次合并“要做的工作太少”？
我的理解是，合并大小为 A 和大小为 B 的排序数组将花费 O(A+B)。为什么 A 和 B 大小相同时效率更高？
我绘制了如何执行 2 minrun 场景的图表，但我仍然感到困惑。
merge rules

最佳答案

对于 2112 个元素，如果所有运行的大小都是 33，那么从 33 到 2112 合并需要 6 个步骤:33 -> 66 -> 132 -> 264 -> 528 -> 1056 -> 2112。如果所有运行的大小都是 32，从 32 合并到 2112 需要 7 个步骤:32 -> 64 -> 128 -> 256 -> 512 -> 1024 -> 2048 -> 2112。
如果算一下，minrun = 33，整个数组分 6 步处理，minrun = 32，几乎整个数组(2048 个元素)分 6 步处理，然后整个数组在第 7 步处理。

关于algorithm - TimSort minRun 选择。为什么完美平衡的合并比不平衡的合并更受欢迎？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/68836191/

26

4

0

文章推荐： hangfire - 如何在运行时确定作业的队列

algorithm - 二叉树属性 - 平衡
我正在尝试了解二叉树的属性。但我不确定一件事: 定义。二叉树的声明: 如果对于每个节点，它认为左子树中的内部节点数和右子树中的内部节点数最多相差 1，则二叉树是平衡的。如果任意两个叶子的差异都存在，
mongodb - mongoDB 平衡
我有一个带有分片键和索引的集合。但是当我运行平衡时，不会为这个集合移动 block ，因为其他集合 block 正在按预期移动到其他机器。此集合中仅移动了一个 block 。最佳答案目前(这将在不
r - 平衡(为每个人创建相同数量的行)数据
给定一个data.table如下，id1是一个subject-level ID，id2是一个within-subject repeated-measure ID，X 是数据变量，其中有很多。我想平衡数
c++ - 平衡 C++ 集
由于 C++ 集合是在二叉树中实现的，如果我们以递增或递减顺序插入项目，那么集合将更像是一个列表而不是树。有没有什么方法可以在插入项目后平衡树？最佳答案 C++ 集(即 std::set)通常实现为
javascript - 移动网站上的变色(平衡)背景图片
我是一名初学者程序员，设计了一个智能手机网站，我有一个主体背景图像，我想慢慢改变颜色平衡，交替颜色，就像有人将 Photoshop 颜色平衡控制条调整一定百分比一样。任一方向。当您查看页面时，这种情况
Java - 平衡 ThreadPoolExecutor 公平地为并行请求提供线程
我开发了一段多线程代码。该代码在 Web 应用程序中调用，因此可能由多个线程(请求)并行调用。为了控制此代码将要创建的线程数量(通过多个并行请求调用)，我使用静态共享 ThreadPoolExecut
c - 平衡 Linux 内核中的内存使用
我正在为 Linux 内核开发一些网络驱动程序。我有几个 if-else 条件，我正在重新分配或释放“skb”结构——这是我有点困惑的地方。关于我在那些 if-else 中做什么 - 我遇到了 2 种
algorithm - 平衡 BST 的最佳和最差搜索性能是什么？
平衡 BST 的最佳和最差搜索性能是什么？每种情况发生时如何用一句话解释？最佳答案最佳情况:当搜索到的元素位于树的根部时。你得到 O(1)。最坏情况:当搜索元素在最长分支的叶子处时，树是单边的。
algorithm - 平衡 AVL 树
我在平衡 AVL 树问题上遇到了麻烦，因为我的解决方案似乎与教科书后面的解决方案冲突。我查看了 AVL 树的在线可视化，他们认为我的是正确的。我的课本错了吗？这是树: 然后我必须将 65 插入到这个
algorithm - 平衡 Controller 输入和输出的技术
我有一个系统，我在其中使用 RS232 来控制一个灯，该灯接受以浮点形式给出的表示电压(在 2.5 - 7.5 范围内)的输入。然后控件会给出 0 到 6000 范围内的输出，这是传感器拾取的亮度。
hadoop - 如何拆分输入集以获得更好的 Hadoop 平衡？
我有一个分层目录，每个目录中有很多文件，每个文本文件中有很多 URL 字符串。我想下载 Hadoop 中所有文件中的所有 URL，以实现更好的平衡。例如，如果我有 1+5 个节点的 Hadoop 集
ios - 平衡 box2d 对象
请查看附件图片，这是一种跷跷板。但从图像来看，黑体具有相同的密度。并且水平矩形使用“Revolute”关节与三角形相连。但仍然没有任何建议。在目前的情况下，它需要平衡。最佳答案由于浮点精度等限制导
c++ - 平衡 KD 树
因此，在平衡 KD 树时，您应该找到中位数，然后将所有较小的元素放在左子树上，将较大的元素放在右子树上。但是，如果您有多个元素与中位数具有相同的值，会发生什么情况？他们进入左子树，右子树还是丢弃它们？
python - 平衡 numpy 数组与过采样
请帮我找到一种干净的方法来从现有数组中创建一个新数组。如果任何类的示例数小于该类中的最大示例数，则应该进行过采样。样本应该从原始数组中提取(随机或顺序都没有区别) 比方说，初始数组是这样的: [ 2
performance - 平衡 Redis 查询和进程内内存？
我是一名软件开发人员，但想成为服务器可扩展性领域的新架构师。在多个服务使用同一数据集的情况下，旨在扩展冗余和负载平衡。问题是:在一个理想主义的系统中，服务是否应该尝试优化它们的内部处理以减少对远程
apache-kafka - 平衡 Kafka 消费者
假设我有 10 个分区用于 Kafka 中的给定主题。我的选择是在消费者之间自动平衡这 10 个分区的负载？我已经阅读了这篇文章 https://stackoverflow.com/a/28580
b-tree - 平衡 B 树如何平衡
假设我有一个 B 树，其节点为 3-4 配置(3 个元素和 4 个指针)。假设我按照规则合法地建立我的树，我是否有可能达到一层中有两个节点并且一个节点有 4 个退出指针而另一个节点只有两个退出指针的情
emacs - 用emacs，如何去配对(平衡)括号
当光标在一个括号上时，如何跳转到配对括号。很高兴在工作emacs -nw . 就像 % 在 Vim 中。 ;;从@Lindy、@Francesco 得到提示后，我发现了更多: C-M-f
data-structures - 平衡 AVL 树
我在平衡 AVL 树时遇到问题。我一直在寻找如何平衡它们的步骤，但我找不到任何有用的东西。我知道有4种: 单左旋单右旋双左右旋转双左右旋转但我就是无法得到如何选择其中之一和在哪个节点上应用
css - 平衡 block 元素，例如打印中的文本行
我想获得类似于打印中平衡文本行但用于 block 元素的结果。假设在一个 300/100 像素的容器中有一组 50/50 像素的盒子。在容器中 float 盒子将使它们填满一“行”，然后像这样包裹到下

首页

博学

6Ren·AI

商城

algorithm - TimSort minRun 选择。为什么完美平衡的合并比不平衡的合并更受欢迎？