search - O(1) 怎么了？-6ren

search - O(1) 怎么了？

转载作者：行者123 更新时间：2023-12-03 06:11:30

24

4

在讨论涉及散列和搜索类型的算法时，我注意到 O(1) 的一些非常奇怪的用法，通常是在使用语言系统提供的字典类型或使用字典或散列数组类型的上下文中使用数组索引表示法。

基本上，O(1) 意味着以恒定时间和(通常)固定空间为界。一些非常基本的操作是 O(1) 的，尽管使用中间语言和特殊的虚拟机往往会扭曲这里的思维(例如，如何将垃圾收集器和其他动态进程分摊到本来是 O(1) 的事件上)。

但是忽略延迟摊销、垃圾收集等，我仍然不明白如何跳跃到假设涉及某种搜索的某些技术可以是 O(1)，除非在非常特殊的条件下。

尽管我之前已经注意到这一点，但 Pandincus question, "'Proper’ collection to use to obtain items in O(1) time in C# .NET?" 中刚刚出现了一个示例.

正如我在那里所说的，我所知道的唯一提供 O(1) 访问作为保证边界的集合是具有整数索引值的固定边界数组。假设该数组是通过某种到随机存取存储器的映射来实现的，该随机存取存储器使用 O(1) 操作来定位具有该索引的单元。

对于涉及某种搜索以确定不同类型索引(或具有整数索引的稀疏数组)的匹配单元格位置的集合，生活并不那么容易。特别是，如果存在冲突并且可能发生拥塞，则访问不完全是 O(1)。如果集合是灵活的，则必须认识到并分摊扩展底层结构(例如树或哈希表)的成本，以缓解拥塞(例如，高冲突发生率或树不平衡) .

我绝不会想到将这些灵活且动态的结构称为 O(1)。然而，我看到它们以 O(1) 解决方案的形式提供，但没有任何确定必须维持的条件才能确保实际具有 O(1) 访问权限(并且该常数小到可以忽略不计)。

问题:所有这些准备实际上都是为了一个问题。 O(1) 的随意性是什么？为什么它被如此盲目地接受？是否认识到即使 O(1) 也可能大得令人不快，尽管接近常数？或者 O(1) 只是计算复杂性概念对非正式使用的挪用？我很困惑。

更新:答案和评论指出了我自己定义 O(1) 时随意的地方，我已经修复了它。我仍在寻找好的答案，在某些情况下，一些评论线程比他们的答案更有趣。

最佳答案

问题是人们对术语真的很草率。这里有 3 个重要但不同的类:

O(1) 最坏情况

这很简单 - 在最坏的情况下，所有操作所花费的时间不会超过恒定的时间，因此在所有情况下都是如此。访问数组的元素是 O(1)最坏的情况。

O(1) 摊销最坏情况

摊销意味着并非每个操作都是 O(1)在最坏的情况下，但对于任何 N 个操作的序列，该序列的总成本为 no O(N)在最坏的情况下。这意味着，即使我们不能将任何单个操作的成本限制为一个常数，但总会有足够的“快速”操作来弥补“慢速”操作，使得操作序列的运行时间是线性的操作次数。

例如，标准 Dynamic Array当它填满时，它的容量会增加一倍，需要 O(1)在末尾插入元素的摊销时间，即使某些插入需要 O(N)时间-总是有足够的O(1)插入 N 个项目总是需要 O(N) 的插入次数总时间。

O(1) 平均情况

这个是最棘手的。平均情况有两种可能的定义:一种用于具有固定输入的随机算法，另一种用于具有随机输入的确定性算法。

对于具有固定输入的随机算法，我们可以通过分析算法并确定所有可能的运行时间的概率分布并对该分布取平均值来计算任何给定输入的平均情况运行时间(取决于算法，由于停机问题，这可能会也可能不会)。

在另一种情况下，我们需要输入的概率分布。例如，如果我们要测量排序算法，这样的概率分布就是包含所有 N! 的分布。输入的可能排列的可能性相同。然后，平均情况运行时间是所有可能输入的平均运行时间，并按每个输入的概率进行加权。

由于这个问题的主题是哈希表，它是确定性的，所以我将重点关注平均情况的第二个定义。现在，我们不能总是确定输入的概率分布，因为我们可以对任何东西进行散列，并且这些项目可能来自用户在文件系统中输入或来自文件系统。因此，在谈论哈希表时，大多数人只是假设输入表现良好，并且哈希函数表现良好，使得任何输入的哈希值本质上在可能的哈希值范围内随机均匀分布。

花一点时间，让我们理解最后一点 - O(1)哈希表的平均情况性能来自于假设所有哈希值均匀分布。如果违反了这一假设(通常不会，但肯定会发生)，则运行时间将不再是 O(1)平均而言。

另请参阅Denial of Service by Algorithmic Complexity 。在本文中，作者讨论了他们如何利用两个版本的 Perl 使用的默认哈希函数中的一些弱点来生成大量具有哈希冲突的字符串。有了这个字符串列表，他们通过向某些网络服务器提供这些字符串来对某些网络服务器产生拒绝服务攻击，从而导致最坏的情况 O(N)网络服务器使用的哈希表中的行为。

关于search - O(1) 怎么了？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/332952/

24

4

0

文章推荐： aurelia - 如何最好地使用 Aurelia 的全局服务类别

文章推荐： macos - 尝试更新brew包管理器时出错

文章推荐： eclipse - 为什么我不能在eclipse中设置断点？

文章推荐： wpf - 使用 WPF WebBrowser 控件时如何抑制脚本错误？

python - HTTP 代码名称\\o/\\o- -o-/o\\在请求中代表什么？
在使用 requests 库中的状态代码时，我遇到了一些奇怪的事情。每个 HTTP 状态代码都有一个常量，有些具有别名(例如，包括 200 的复选标记): url = 'https://httpbin
javascript - 这两行是什么意思 : o[x] = o[x] || {}; o = o[x];
这是我得到的代码，但我不知道这两行是什么意思: o[arr[i]] = o[arr[i]] || {}; o = o[arr[i]]; 完整代码: var GLOBAL={}; GLOBAL.name
big-o - O(n) 的算法怎么可能也是 O(n^2)、O(n^1000000)、O(2^n)？
所以这个问题的答案What is the difference between Θ(n) and O(n)? 指出“基本上，当我们说算法是 O(n) 时，它也是 O(n2)、O(n1000000)、O
infinity - O 表示法，O(∞) = O(1)？
这是一个快速的想法；有人会说 O(∞) 实际上是 O(1) 吗？我的意思是它不依赖于输入大小？所以在某种程度上它是恒定的，尽管它是无限的。或者是唯一“正确”的表达方式 O(∞)？最佳答案无穷
big-o - O(日志(A))+ O(日志(B))= O(日志(A * B))？
这是真的: log(A) + log(B) = log(A * B) [0] 这也是真的吗？ O(log(A)) + O(log(B)) = O(log(A * B)) [1] 据我了解 O(f
big-o - O(N) + O(M) 和 O(N + M) 之间有什么区别。有没有？
我正在解决面试练习的问题，但我似乎无法找出以下问题的时间和空间复杂度的答案: Given two sorted Linked Lists, merge them into a third list i
big-o - O(O(f(n))) 是什么意思？
我了解 Big-Oh 表示法。但是我该如何解释 O(O(f(n))) 是什么意思呢？是指增长率的增长率吗？最佳答案 x = O(n)基本上意味着 x <= kn对于一些常量 k . 因此 x = O
javascript - o[str] 与 (o => o.str)
我正在编写一个函数，该函数需要一个对象和一个投影来了解它必须在哪个字段上工作。我想知道是否应该使用这样的字符串: const o = { a: 'Hello There' }; funct
algorithm - O(nlogn)+O(n)、O(nlogn) 和 O(nlogn + n) 之间的关系是什么？
直觉上，我认为这三个表达式是等价的。例如，如果一个算法在 O(nlogn) + O(n) 或 O(nlogn + n) 中运行(我很困惑)，我可以假设这是一个O(nlogn) 算法？什么是真相？
python - O(n) + O(n) = O(n)？
根据 O'Reilly 的 Python in a Nutshell 中的 Alex Martelli，复杂度类 O(n) + O(n) = O(n)。所以我相信。但是我很困惑。他解释说:“N 的两个
big-o - 大 O 符号 : differences between O(n^2) and O(n. log(n))？
O(n^2)有什么区别和 O(n.log(n)) ? 最佳答案 n^2 的复杂性增长得更快。关于big-o - 大 O 符号 : differences between O(n^2) and O(n
php - < o : p > & nbsp ; display error
每当我收到来自 MS outlook 的电子邮件时，我都会收到此标记 & nbsp ; (没有空格)哪个显示为？在 <>. 当我将其更改为 ISO-8859-1 时，浏览器页面字符集编码为 UTF-8
algorithm - Big-Oh : How can O(n) + O(n) + . .. + O(n) 等于 O(n^2)？
我很难理解 Algorithms by S. Dasgupta, C.H. Papadimitriou, and U.V. Vazirani - page 24 中的以下陈述它们将 O(n) 的总和表
big-o - 两次通过数组 O(n) 或 O(2n)
我在面试蛋糕上练习了一些问题，并在问题 2给出的解决方案使用两个单独的 for 循环(非嵌套)，解决方案提供者声称他/她在 O(n) 时间内解决了它。据我了解，这将是 O(2n) 时间。是我想错了吗，
c# - Java语法问题: O accept(ObjectVisitorEx visitor)
关于 Java 语法的幼稚问题。什么 T accept(ObjectVisitorEx visitor); 是什么意思？ C# 的等价物是什么？最佳答案在 C# 中它可能是: O Accept(
algorithm - O(nlogn) + O(n) 的时间复杂度是否只是 O(nlogn)？
假设我有一个长度为 n 的数组，我使用时间为 nlogn 的排序算法对它进行了排序。得到这个排序后的数组后，我遍历它以找到任何具有线性时间的重复元素。我的理解是，由于操作是分开发生的，所以时间是 O(
algorithm - O(1)+O(2)+ .... +O(n) 的阶和
总和 O(1)+O(2)+ .... +O(n) 的计算结果是什么？我在某处看到它的解决方案: O(n(n+1) / 2) = O(n^2) 但我对此并不满意，因为 O(1) = O(2) = co
big-o - 什么是大 O 符号？你是如何想出像 O(n) 这样的数字的？
这个问题在这里已经有了答案: 11 年前关闭。 Possible Duplicate: Plain english explanation of Big O 我想这可能是类里面教的东西，但作为一个自学
big-o - O(n) 算法的计算时间可以超过 O(n^2) 吗？
假设我有两种算法: for (int i = 0; i 2)更长的时间给定的一些n - 其中n这种情况的发生实际上取决于所涉及的算法 - 对于您的具体示例， n 2)分别时间，您可能会看到: Θ(n)
big-o - 感叹号在 big-o 中是什么意思，即 O(X!)？
这个问题在这里已经有了答案: Example of a factorial time algorithm O( n! ) (4 个回答) 6年前关闭。我见过表示为 O(X!) 的 big-o 示例但

首页

博学

6Ren·AI

商城