- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
在算法分析类中,我们看到了 Kruskal 算法的伪代码:
然后,对于不相交的森林,他陈述如下:
A sequence of m MAKE-SET, UNION, and FIND-SET operations, n of which are MAKE-SET operations, can be performed on a disjoint-set forest with union by rank and path compression in worst-case time O(m α(n)).
Used to compute the complexity of Step 2, and steps 5-8
For connected G: |E| ≥ |V| -1; m = O(V + E), n = O(V);
So Steps 2, 5-8: O((V + E) α(V)) = O(E α(V))
α(V) = O(lg V) = O(lg E); so we obtain O(E lg E) ----- // how is α(V) equal here?
Kruskal: Steps 3, 5-8, and step 4: O(E lg E)
观察:|E| < |V|2 -> lg E = O(lg V)
所以,Kruskal 复杂度:O(E lg V)
我试图理解这个“alpha(n)”/“α(n)”函数背后的逻辑,从我读到的内容来看,简单地说,Ackermann 函数是一个以难以置信的速度呈指数增长的函数,反之则以对数方式极其缓慢地增长。
如果我的解释是正确的,“α(n)”代表什么?这是否意味着 MAKE-SET 操作至多为 O(lg n)?如何/为什么需要使用逆阿克曼?我的印象是这个操作执行了 V 次(对于每个顶点)。随之,α(V)也简化为O(lg V) = O(lg E),这是否意味着α(V)最大可以表示为O(lg V)?
另外,为什么|E| < |V|^2 -> lg E = O(lg V) 声明,怎么知道 |E| < |V|^2?
我认为我的问题真正归结为,当我的讲师说它们都是 O(E log V) 时,为什么不相交集的“森林”表示似乎比使用链表实现的那些更有效?因此,使用森林实现不相交集的难度增加是否有意义?
最佳答案
α(V) = O(lg V) 是一种常见的符号滥用,实际上我们有 α(V) ∈ O(lg V)(V 的逆阿克曼是函数集 O(lg五))。它们不相等,它们甚至不是同一类型,一个是一个函数,另一个是一组函数。
how is it known that that |E| < |V|²?
一个完整的无向图有多少条边?你不能拥有更多。您可以在多图中进行操作,但这不是该算法的运算对象,将其扩展到多图中是没有用的 - 只需丢弃一对节点之间的最佳边缘以外的所有边缘。
why is it that a "forest" representation of disjoint sets seems to be more efficient than those implemented with linked lists when my lecturer states they are both O(E log V)?
出于几个原因,这是一件很奇怪的事情。首先,您是通过 Kruskals 算法而不是它自己有效地测量不相交集的效率。 “他们”是您的问题,是 Kruskals 算法的两种实现。其次,正如您肯定意识到的那样,上界的推导使用了 α(V) ∈ O(lg V)。所以它故意忽略了一个显着的差异。这是有道理的,因为时间复杂度逐渐由排序步骤决定,但仅仅因为差异在大 O 中不可见并不意味着它不存在。
Therefore is there a point in the increased difficulty of implementing disjoint sets with forests?
确实没有增加难度。这是一个 super 简单的数据结构,您可以在 5 分钟内编写,只需两个数组和一些简单的代码 - 链表实际上可能更难,特别是如果您必须进行手动内存管理。请注意,在 Kruskals 算法的上下文之外,渐近时间和实际时间的差异是巨大的。
但即使在 Kruskals 算法的背景下,改进算法的第二阶段显然会使总时间更好,即使它没有显示在最坏情况下的渐近时间。 FWIW 你也可以改进第一阶段,你可以使用堆(或者它的一个更高级的替代品)并且只在线性时间内堆化边缘。然后算法的第二阶段将一个一个地提取它们,但至关重要的是,您通常不必提取每个边 - 您可以跟踪剩下多少不相交的集合并在提取时停止下降到 1,可能会留下许多(甚至大多数)未使用的边缘。在最坏的情况下这无济于事,但在现实生活中却有帮助。在特殊情况下,当任何快速排序(计数排序、桶排序等)适用时,您可以比 O(E log E) 更快地对边进行排序。
关于algorithm - 为什么使用逆阿克曼函数来描述 Kruskal 算法的复杂性?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44354922/
我是一名优秀的程序员,十分优秀!