- iOS/Objective-C 元类和类别
- objective-c - -1001 错误,当 NSURLSession 通过 httpproxy 和/etc/hosts
- java - 使用网络类获取 url 地址
- ios - 推送通知中不播放声音
情景
我有几个数字范围。这些范围不重叠——因为它们不重叠,逻辑上的结果是任何时候都不能有一个数字属于一个以上的范围。每个范围是连续的(单个范围内没有空洞,因此范围 8 到 16 将真正包含 8 到 16 之间的所有数字),但两个范围之间可以有空洞(例如范围从 64 开始到 128,下一个范围从 256 开始到 384),因此某些数字可能根本不属于任何范围(在此示例中,数字 129 到 255 不属于任何范围)。
问题
我得到一个数字,需要知道该数字属于哪个范围......如果它属于任何范围。否则我需要知道它不属于任何范围。速度当然很重要;我不能简单地检查 O(n) 的所有范围,因为可能有数千个范围。
简单的解决方案
一个简单的解决方案是将所有数字保存在一个排序的数组中并对其运行二进制搜索。那至少会给我 O(log n)。当然,二分搜索必须进行一些修改,因为它必须始终检查范围的最小和最大数字。如果要查找的数字介于两者之间,则我们找到了正确的范围,否则我们必须搜索低于或高于当前数字的范围。如果最后只剩下一个范围并且数字不在该范围内,则该数字根本不在范围内,我们可以返回“未找到”结果。
范围也可以以某种树结构链接在一起。这基本上就像一个带有二进制搜索的排序列表。优点是修改树比排序数组(添加/删除范围)更快,但不像我们浪费一些额外的时间来保持树的平衡,随着时间的推移,树可能会变得非常不平衡,这将导致搜索比对排序数组的二分搜索慢得多。
可以争论哪种解决方案更好或更差,因为在实践中搜索和修改操作的数量几乎是平衡的(每秒执行的搜索和添加/删除操作数量相同)。
问题
对于这类问题,是否有比排序列表或树更好的数据结构?在最好的情况下可能比 O(log n) 更好,在最坏的情况下可能比 O(log n) 更好?
以下是可能对这里有所帮助的一些附加信息: 所有范围始终以 2 的幂的倍数开始和结束。它们总是以 2 的相同幂开始和结束(例如,它们都以 4 的倍数或 8 的倍数或 16 的倍数等开始/结束)。两个的幂在运行期间不能改变。在添加第一个范围之前,必须设置 2 的幂,并且所有添加的范围必须以该值的倍数开始/结束,直到应用程序终止。我认为这可以用于优化,好像它们都以例如的倍数开始。 8,我可以忽略所有比较操作的前 3 位,其他位单独告诉我范围(如果有)。
我阅读了有关部分和范围树的信息。这些是问题的最佳解决方案吗?有没有可能更好的解决方案?这个问题听起来类似于 malloc 实现必须做的事情(例如,每个释放的内存块都属于一个可用内存范围,而 malloc 实现必须找出哪一个),那么这些通常如何解决问题?
最佳答案
在运行了各种基准测试后,我得出结论,只有树状结构才能在这里工作。排序列表当然显示了良好的查找性能 - O(log n) - 但它显示了可怕的更新性能(与树相比,插入和删除的速度要慢 10 倍以上!)。
平衡二叉树也具有 O(log n) 查找性能,但是更新速度要快得多,也在 O(log n) 左右,而排序列表更像 O(n) 用于更新 (O(log n) 到找到插入的位置或要删除的元素,但是最多必须在列表中移动 n 个元素,这是 O(n))。
我实现了一个 AVL 树、一个红黑树、一个 Treap、一个 AA 树和 B 树的各种变体(B 在这里表示拜耳树,而不是二叉树)。结果:拜耳树几乎从未获胜。它们的查找很好,但它们的更新性能很差(因为在 B-Tree 的每个节点中,您又拥有一个排序列表!)。拜耳树仅在读取/写入节点是非常慢的操作的情况下(例如,当节点直接从硬盘读取或写入硬盘时)更胜一筹 - 因为 B-Tree 必须读取/写入的节点比任何其他节点少得多树,所以在这种情况下它会赢。但是,如果我们将这棵树留在内存中,那么它就没有机会对抗其他树,对所有 B-Tree 粉丝感到抱歉。
Treap 最容易实现(少于其他平衡树所需的代码行数的一半,仅是不平衡树所需代码的两倍)并且在查找和更新方面表现出良好的平均性能......但我们可以做得更好那。
AA-Tree 显示出惊人的良好查找性能——我不知道为什么。他们有时会击败所有其他树(不是到目前为止,但仍然足以不巧合)......并且移除性能还可以,但是除非我太愚蠢而无法正确实现它们,否则插入性能真的很差(它执行每个插入的树旋转比任何其他树都多 - 即使是 B-Tree 也具有更快的插入性能)。
这给我们留下了两个经典,AVL 和 RB-Tree。它们都非常相似,但经过数小时的基准测试,有一点很清楚:AVL 树肯定比 RB-Tree 具有更好的查找性能。差异并不大,但在所有基准测试中,他们将赢得 2/3 的查找测试。不足为奇,毕竟 AVL 树比 RB-Tree 更严格地平衡,因此在大多数情况下它们更接近最优二叉树。我们在这里谈论的不是巨大的差异,它总是一场势均力敌的比赛。
另一方面,RB Trees 在几乎所有的测试运行中都击败了 AVL Trees,这并不是一场势均力敌的比赛。和以前一样,这是意料之中的。与 AVL 树相比,不那么严格平衡的 RB 树在插入时执行的树旋转要少得多。
删除节点怎么样?这里似乎很大程度上取决于节点的数量。对于小节点数(小于 50 万)RB 树再次拥有 AVL 树;差异甚至比插入更大。相当出乎意料的是,一旦节点数量增长到超过一百万个节点,AVL 树似乎就会 catch ,并且与 RB 树的差异会缩小,直到它们或多或少同样快。不过,这可能是系统的影响。它可能与进程的内存使用或 CPU 缓存等有关。对 RB 树的负面影响比对 AVL 树的负面影响更大,因此 AVL 树可以 catch 。对于查找(无论有多少节点,AVL 通常更快)和插入(无论有多少节点,RB 通常更快)没有观察到相同的效果。
结论:
我认为我能得到的最快速度是使用 RB-Trees,因为查找的数量只会比插入和删除的数量略高一些,而且无论 AVL 在查找时有多快,整体性能都会受到更差的插入的影响/删除性能。
也就是说,除非这里有人可能想出一个更好的数据结构来拥有大量的 RB 树 ;-)
关于algorithm - 快速算法在一组范围中快速找到一个数字所属的范围?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1193477/
我需要将文本放在 中在一个 Div 中,在另一个 Div 中,在另一个 Div 中。所以这是它的样子: #document Change PIN
奇怪的事情发生了。 我有一个基本的 html 代码。 html,头部, body 。(因为我收到了一些反对票,这里是完整的代码) 这是我的CSS: html { backgroun
我正在尝试将 Assets 中的一组图像加载到 UICollectionview 中存在的 ImageView 中,但每当我运行应用程序时它都会显示错误。而且也没有显示图像。 我在ViewDidLoa
我需要根据带参数的 perl 脚本的输出更改一些环境变量。在 tcsh 中,我可以使用别名命令来评估 perl 脚本的输出。 tcsh: alias setsdk 'eval `/localhome/
我使用 Windows 身份验证创建了一个新的 Blazor(服务器端)应用程序,并使用 IIS Express 运行它。它将显示一条消息“Hello Domain\User!”来自右上方的以下 Ra
这是我的方法 void login(Event event);我想知道 Kotlin 中应该如何 最佳答案 在 Kotlin 中通配符运算符是 * 。它指示编译器它是未知的,但一旦知道,就不会有其他类
看下面的代码 for story in book if story.title.length < 140 - var story
我正在尝试用 C 语言学习字符串处理。我写了一个程序,它存储了一些音乐轨道,并帮助用户检查他/她想到的歌曲是否存在于存储的轨道中。这是通过要求用户输入一串字符来完成的。然后程序使用 strstr()
我正在学习 sscanf 并遇到如下格式字符串: sscanf("%[^:]:%[^*=]%*[*=]%n",a,b,&c); 我理解 %[^:] 部分意味着扫描直到遇到 ':' 并将其分配给 a。:
def char_check(x,y): if (str(x) in y or x.find(y) > -1) or (str(y) in x or y.find(x) > -1):
我有一种情况,我想将文本文件中的现有行包含到一个新 block 中。 line 1 line 2 line in block line 3 line 4 应该变成 line 1 line 2 line
我有一个新项目,我正在尝试设置 Django 调试工具栏。首先,我尝试了快速设置,它只涉及将 'debug_toolbar' 添加到我的已安装应用程序列表中。有了这个,当我转到我的根 URL 时,调试
在 Matlab 中,如果我有一个函数 f,例如签名是 f(a,b,c),我可以创建一个只有一个变量 b 的函数,它将使用固定的 a=a1 和 c=c1 调用 f: g = @(b) f(a1, b,
我不明白为什么 ForEach 中的元素之间有多余的垂直间距在 VStack 里面在 ScrollView 里面使用 GeometryReader 时渲染自定义水平分隔线。 Scrol
我想知道,是否有关于何时使用 session 和 cookie 的指南或最佳实践? 什么应该和什么不应该存储在其中?谢谢! 最佳答案 这些文档很好地了解了 session cookie 的安全问题以及
我在 scipy/numpy 中有一个 Nx3 矩阵,我想用它制作一个 3 维条形图,其中 X 轴和 Y 轴由矩阵的第一列和第二列的值、高度确定每个条形的 是矩阵中的第三列,条形的数量由 N 确定。
假设我用两种不同的方式初始化信号量 sem_init(&randomsem,0,1) sem_init(&randomsem,0,0) 现在, sem_wait(&randomsem) 在这两种情况下
我怀疑该值如何存储在“WORD”中,因为 PStr 包含实际输出。? 既然Pstr中存储的是小写到大写的字母,那么在printf中如何将其给出为“WORD”。有人可以吗?解释一下? #include
我有一个 3x3 数组: var my_array = [[0,1,2], [3,4,5], [6,7,8]]; 并想获得它的第一个 2
我意识到您可以使用如下方式轻松检查焦点: var hasFocus = true; $(window).blur(function(){ hasFocus = false; }); $(win
我是一名优秀的程序员,十分优秀!