- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
给定两个排序的数字数组,我们希望找到第k个可能和最大的一对。(一对是第一个数组中的一个元素和第二个数组中的一个元素)。例如,使用数组
[2,3,5,8,13]
[4,8,12,16]
和最大的一对是
13+16=29
13+12=25
8+16=24
13+8=21
8+12=20
所以第四大和的对是(13,8)。如何找到第k个最大可能和的一对?
还有,最快的算法是什么?数组已经排序,大小为m和n。
我已经知道o(klogk)解决方案,使用max heap givenhere。
这也是google最喜欢的面试问题之一,他们需要一个o(k)的解决方案。
我也读到有一个O(k)解,我无法理解。
有人能用伪代码解释正确的解决方案吗?
附笔。
请不要将this链接发布为答案/评论。它不包含答案。
最佳答案
我从一个简单但不是很线性的时间算法开始。我们在array1[0]+array2[0]
和array1[N-1]+array2[N-1]
之间选择一些值。然后我们确定有多少对和大于这个值,有多少对和小于这个值。这可以通过使用两个指针迭代数组来完成:当sum太大时,指向第一个数组的指针递增,当sum太小时,指向第二个数组的指针递减。对不同的值重复此过程,并使用二进制搜索(或单侧二进制搜索),我们可以在o(n log r)时间内找到第k个最大和,其中n是最大数组的大小,r是array1[N-1]+array2[N-1]
和array1[0]+array2[0]
之间的可能值的数目。只有当数组元素是由小的常数约束的整数时,该算法才具有线性时间复杂度。
当二元搜索范围内的对和数从o(n2)减少到o(n)时,停止二元搜索可以改进原有的算法。然后用这些对和填充辅助阵列(这可以用稍加修改的两指针算法来完成)。然后,利用该算法求出该辅助数组的k个最大和。所有这些都不能改善最坏情况的复杂性,因为我们仍然需要O(log R)二进制搜索步骤。如果我们保留了这个算法的quickselect部分,但是(为了得到合适的值范围),我们使用了比二进制搜索更好的方法呢?
我们可以使用以下技巧估计值范围:从每个数组中获取每一个第二元素,并尝试为这半个数组找到秩k/4
的对和(使用相同的递归算法)。显然,这应该给出所需值范围的一些近似值。事实上,这个技巧稍加改进的变体给出了只包含o(n)元素的范围。这在下面的文章中得到了证明:"Selection in X + Y and matrices with sorted rows and columns" by A. Mirzaian and E. Arjomandi。本文详细地介绍了除AA>以外的算法的所有部分的算法、证明、复杂度分析和伪代码。如果需要线性最坏情况复杂度,则可以用Quickselect算法进行快速选择。
该算法具有O(n)的复杂性。如果其中一个数组比另一个数组短(m
我上传了简单的C++ 11实现到
Median of medians。代码没有经过优化,也没有经过彻底测试。我试图使它尽可能接近伪代码的链接文件。这个实现使用了cc,它只允许线性复杂度(不是最坏情况)。
一种完全不同的求线性时间第k和的方法是基于优先级队列(pq)。一种变化是向pq插入最大的对,然后重复删除pq的顶部,而不是最多插入两对(一个数组中的索引递减,另一个数组中的索引递减)。并采取措施防止插入重复对。另一个变化是插入包含第一个数组最大元素的所有可能对,然后重复删除pq的顶部,而不是在第一个数组中插入索引递减的对,在第二个数组中插入索引相同的对。在这种情况下,不必为复制品操心。
op提到了o(k logk)解决方案,其中pq被实现为最大堆。但在某些情况下(当数组元素在有限的范围内均匀分布整数时,只需要平均值,而不是最坏情况),我们可以使用O(1)时间优先队列,如本文所述:
ideone。这允许O(k)期望的时间复杂度。
这种方法的优点是可以按排序顺序提供前k个元素。缺点是数组元素类型的选择有限,算法更复杂和较慢,较差的渐近复杂度:O(k)>O(n)。
关于performance - 如何找到具有第k个最大和的对?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18557175/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!