- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
二分搜索对于均匀分布非常有效。您列表中的每个成员都有相同的“命中”概率。这就是您每次都尝试中心的原因。
对于非均匀分布是否有有效的算法?例如服从 1/x 分布的分布。
最佳答案
二叉搜索和二叉树之间有着深刻的联系——二叉树基本上是一种“预先计算”的二叉搜索,其中切割点由树的结构决定,而不是在搜索运行时选择。事实证明,处理每个键的概率“权重”有时是用二叉树完成的。
一个原因是因为它是一棵相当普通的二叉搜索树,但事先已知,包含查询概率的知识。
Niklaus Wirth 在他的“算法和数据结构”一书中介绍了这一点,有几种变体(一种用于 Pascal,一种用于 Modula 2,一种用于 Oberon),至少可以从他的 web site 下载其中一种。 .
不过,二叉树并不总是二叉搜索树,二叉树的一种用途是派生 Huffman compression code .
无论哪种方式,二叉树的构建都是从叶子分开开始,然后在每一步中将两个最不可能的子树连接成一个更大的子树,直到只剩下一个子树。为了在每一步有效地挑选出两个最不可能的子树,使用了一个优先级队列数据结构——可能是一个binary heap。 .
一棵构建一次就永远不会修改的二叉树可以有多种用途,但是可以有效更新的二叉树更有用。那里有一些权重平衡的二叉树数据结构,但我不熟悉它们。当心 - 术语“权重平衡”通常用于每个节点始终具有权重 1,但子树权重大致平衡的情况。其中一些可能适用于不同的节点权重,但我不确定。
无论如何,对于数组中的二分查找,问题是可以使用任意概率分布,但效率低下。例如,您可以有一个运行总权重数组。对于二分搜索的每次迭代,您想要确定概率分布点的一半,因此您确定其值然后搜索运行总权重数组。您为主要二分搜索获得了完美的权重平衡的下一个选择,但您必须对正在运行的总数组进行完整的二分搜索才能做到这一点。
但是,如果您可以在不搜索已知概率分布的情况下确定加权中点,则该原则有效。原理是一样的——你需要概率分布的积分(替换运行总数组),当你需要一个中点时,你可以选择它来获得积分的精确中心值。这与其说是编程问题,不如说是代数问题。
像这样的加权二分搜索的一个问题是最坏情况下的性能更差 - 通常是常数因子,但如果分布足够偏斜,您可能最终会得到有效的线性搜索。如果您假设的分布是正确的,尽管搜索偶尔会很慢,但平均情况下的性能会得到改善,但如果您的假设分布是错误的,那么当许多搜索是针对根据该分布不太可能出现的项目时,您可能会为此付出代价。在二叉树形式中,“不太可能”的节点比它们在简单平衡(假设平坦概率分布)二叉树中离根更远。
平坦概率分布假设即使在完全错误的情况下也能很好地发挥作用 - 最坏的情况是好的,而最好的和平均的情况必须至少按照定义那么好。您离平坦分布越远,如果实际查询概率与您的假设大相径庭,情况就会越糟。
关于performance - 不均匀分布的二进制搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16872675/
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 8年前关闭。 Improve t
暂时忘记能力的定义,只关注能力的“检查”(使用“授权!”),我看到 CanCan 添加了大约 400 毫秒,用于简单地检查用户是否具有特定的能力主题/模型。 这是预期的吗(我假设不是)?或者,有没有可
我正在阅读有关 Swift 的教程 ( http://www.raywenderlich.com/74438/swift-tutorial-a-quick-start ),它预定义为不显式设置类型,因
这主要是由于对 SQL 问题的回答。由于性能原因,有意省略了 UDF 和子查询。我没有包括可靠性并不是说它应该被视为理所当然,但代码必须工作。 性能永远是第一位的吗?提供了许多以性能为主要优先事项的答
我已经编写了一个简单的测试平台来测量三种阶乘实现的性能:基于循环的,非尾递归的和尾递归的。 Surprisingly to me the worst performant was the loop o
我已将 ui-performance 插件应用到我的应用程序中。不幸的是,在开发模式下运行应用程序时它似乎不起作用。例如,我的 javascript 导入是用“vnull”版本呈现的。 例如 不会
我有一个我操作的 F# 引用(我在各处添加对象池以回收经常创建和删除的短期对象)。我想运行结果报价;现在我使用了 F# PowerPack,它提供了将引用转换为表达式树和委托(delegate)的方法
我正在尝试在 Spark 服务器上运行 SparklyR 库中的机器学习算法。 1 个簇 8 核 24G内存 Ubuntu 16.04 星火2.2 独立配置 1名师傅/2名 worker 每个执行器的
我有一个数据库(准确地说是在 postgres 上运行),具有以下结构: user1 (schema) | - cars (table) - airplanes (table, again) .
我的应用程序在我的 iPad 上运行。但它的表现非常糟糕——我的速度低于 15fps。谁能帮我优化一下? 它基本上是一个轮子(派生自 UIView),包含 12 个按钮(派生自 UIControl)。
在完成“Scala 中的函数式编程原则”@coursera 类(class)第 3 周的作业时,我发现当我实现视频类(class)中所示的函数联合时: override def union(tha
我正在重构我的一个 Controller 以使其成为一项服务,我想知道不将整个服务容器注入(inject)我的 Controller 是否会对性能产生影响。 这样效率更高吗: innova.path.
我有一个要显示的内容很大的文件。例如在显示用户配置文件时, 中的每个 EL 表达式需要一个 userId 作为 bean 的参数,该参数取自 session 上下文。我在 xhtml 文件中将这个 u
我非常了解 mipmapping。我不明白(在硬件/驱动程序级别)是 mipmapping 如何提高应用程序的性能(至少这是经常声称的)。在执行片段着色器之前,驱动程序不知道要访问哪个 mipmap
这个问题在这里已经有了答案: 10年前关闭。 Possible Duplicate: What's the (hidden) cost of lazy val? (Scala) Scala 允许定义惰
一些文章建议现在 build() 包含在 perform() 本身中,而其他人则建议当要链接多个操作时使用 build().perform()一起。 最佳答案 build() 包含在 perform(
Postgres docs说 For best optimization results, you should label your functions with the strictest vol
阅读Zero-cost abstractions看着 Introduction to rust: a low-level language with high-level abstractions我尝
我想在 MQ 服务器上部署 SSL,但我想知道我当前的 CPU 容量是否支持 SSL。 (我没有预算增加 CPU 内核和 MQ PVU 的数量) 我的规范: Windows 2003 服务器 SP2,
因此,我在 Chrome 开发者工具 的性能 选项卡内的时间 部分成功地监控了我的 React Native 应用程序的性能。 突然在应用程序的特定重新加载时,Timings 标签丢失。 我已尝试重置
我是一名优秀的程序员,十分优秀!