algorithm - 为什么哈希表扩展通常通过将大小加倍来完成？-6ren

algorithm - 为什么哈希表扩展通常通过将大小加倍来完成？

转载作者：塔克拉玛干更新时间：2023-11-03 02:13:46

26

4

我对哈希表做了一些研究，我一直在运行经验法则，当有一定数量的条目时(最大值或通过 75% 之类的负载因子)，哈希表应该被扩展.

几乎总是，建议将哈希表的大小加倍(或加倍加 1，即 2n+1)。但是，我一直没能为此找到充分的理由。

为什么要将大小加倍，而不是将其增加 25%，或者将其增加到下一个素数或下 k 个素数(例如，3)的大小？

我已经知道，选择素数作为初始哈希表大小通常是个好主意，至少如果您的哈希函数使用模数(例如通用哈希)。我知道这就是为什么通常建议使用 2n+1 而不是 2n(例如 http://www.concentric.net/~Ttwang/tech/hashsize.htm )

但是，正如我所说，我还没有看到任何真正的解释，说明为什么加倍或加倍加一实际上是一个不错的选择，而不是选择新哈希表大小的其他方法。

(是的，我已经阅读了关于哈希表的维基百科文章:) http://en.wikipedia.org/wiki/Hash_table

最佳答案

例如，如果调整大小是按恒定增量进行的，则哈希表不能声明“摊销的恒定时间插入”。在那种情况下，调整大小的成本(随着哈希表的大小而增长)将使一次插入的成本与要插入的元素总数成线性关系。由于随着表的大小调整大小变得越来越昂贵，因此必须“越来越少地”发生以保持插入的摊销成本不变。

大多数实现允许平均桶占用增长到一个边界，直到在调整大小之前预先固定(0.5 到 3 之间的任何值，这些都是可接受的值)。按照这个约定，在调整大小后，平均存储桶占用量变为该范围的一半。通过加倍调整大小使平均桶占用保持在宽度 *2 的范围内。

子注:由于统计聚类，如果您希望许多桶最多有一个元素，则必须将平均桶占用率低至 0.5(忽略缓存大小的复杂影响的最大查找速度)，或者如果您想要最少数量的空桶(对应于浪费的空间)，则可高达 3。

关于algorithm - 为什么哈希表扩展通常通过将大小加倍来完成？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/2369467/

26

4

0

文章推荐： algorithm - 平均案例与摊销分析之间的差异

文章推荐： c++ - 套接字:大消息性能

文章推荐： c++ - 识别 Visual Studio 中的重载运算符 (c++)

文章推荐： algorithm - 找到所有 4 位吸血鬼数字

必须加载 PHP 扩展 "curl"。必须加载 PHP 扩展 "soap"
我是 magento 的新手，目前我在 magento 安装期间遇到“必须加载 PHP 扩展 curl ”错误。你能帮帮我吗？最佳答案如果您的服务器上没有安装 curl，您可以键入以下命令之一来安
php - $ Composer 找不到 mongodb 扩展，需要 Mongodb 扩展
我在 macOS Mojave/macOS Big Sur/macOS Monterey/macOS Ventura 上使用最新的 php 版本 7.2 并收到类似错误 $composer requ
java - Integer 扩展 Number 但无法对
这个问题已经有答案了: Why generic type is not applicable for argument extends super class for both? (5 个回答) 已关
javascript - 在默认 NightWatch 浏览器实例中启用和修改 Chome 扩展(特别是 ModHeader 扩展)
我正在使用 NightWatch.js 并进行一些 UI 测试，我想用一些额外的 desiredCapabilities 启动默认浏览器实例(即启用扩展并应用一些特定值)。 p> 注意:我可以执行这些
java - 扩展 server_name(SNI 扩展)未随 JAVA 8 一起发送
有人知道为什么我在 java 8 中使用此代码时没有服务器扩展名称吗: try { URL url = new URL(urlString); URLC
dart - 扩展 dart 类类似于 js 原型(prototype)或 swift 扩展
扩展提供给我的类(class)。为现有的类提供新功能。或扩展现有的mixin s 或虚拟类，任何东西都可以工作。也许是这样的: class FlatButton {} // maybe no
python - 使用 c 扩展 python/django，使用 apache 扩展 mod_wsgi
我有一个关于使用 c 代码和 mod_wsgi 扩展 python 的问题。我在 apache 服务器中有一个 django 应用程序，它查询 postgresql 数据库以生成报告。在某些报告中，
google-chrome - testcafe 是否支持加载任何 crx 扩展，并使用 chrome 浏览器中的自定义 header 值设置 ModHeader 扩展
testcafe支持在Chrome浏览器中加载crx扩展吗？如果是这样，请告诉我需要尝试什么方法。我尝试了下面的代码，但没有成功 await t.eval(new Function(fs.read
java - 在 Java 中，类 B 扩展 A 和类 B 扩展 A 之间有什么区别
这个问题已经有答案了: What is a raw type and why shouldn't we use it? (16 个回答) 已关闭 3 年前。有什么区别: // 1 class A c
javascript - 单击 chrome 扩展 DOM(popup.html) 上的按钮时，扩展 DOM 关闭并且不会在 popup.js 中调用 onclick 函数
我正在编写一个 chrome 扩展来记录单击开始按钮后触发的请求。这是我的文件:1. list .json { "manifest_version": 2, "name": "recorde
大语言模型提示技巧（七）－扩展
扩展是将较短的文本，例如一组提示或主题列表，输入到大型语言模型中，让模型生成更长的文本。我们可以利用这个特性让大语言模型生成基于某个主题的电子邮件或小论文。通过这种方式使用大语言模型，可以为工作与生活
Vim # 扩展
我每天都在使用 vim 和 perforce 现在我的问题是，如果我想查看 perforce 文件修订版，则从命令模式下的 vim :!p4 打印文件#1 vim 试图让我获得缓冲区 #1。有没有办法
NUnit 扩展
大家好，我有一个关于 NUnit 扩展(2.5.10)的问题。我想做的是向数据库。为此，我使用 Event 创建了 NUnit 扩展听众。我遇到的问题是公共(public)无效 TestFin
扩展。通过单击不在窗口中关闭弹出窗口
我有弹出窗口，而不是模态窗口。如何通过单击页面的其他部分(不在窗口中)来关闭此窗口？最佳答案像这样的东西: function closeWin(e, t) { var el = win.
C# 扩展
我通常非常谨慎地使用扩展方法。当我确实觉得有必要编写一个扩展方法时，有时我想重载该方法。我的问题是，您对调用其他扩展方法的扩展方法有何看法？不好的做法？感觉不对，但我无法真正定义原因。例如，第二个
16、扩展 Ant
扩展 Ant Ant带有一组预定义的任务，但是你可以创建自己的任务，如下面的例子所示。定制Ant 任务应扩展 org.apache.tools.ant.Task 类，同时也应该拓展 execut
用于重定向文件的 Firefox 扩展
我想要一个重定向所有请求的扩展: http://website.com/foo.js 到: http://localhost/myfoo.js 我无法使用主机文件将主机从 website.com 编辑
c++ - 扩展 QChartView
对于为什么 QChartView 放在 QTabWidget 中时会扩展，我有点迷惑。这是 QChartView 未展开(因为它被隐藏)时应用程序的图片。应用程序的黑色部分是 QOpenGLWid
oracle - 如何避免 OR 扩展？
如果在连接条件中使用 OR 运算符，如何优化以下查询以避免 SQL 调优方面的 OR 扩展？ SELECT t1.A, t2.B, t1.C, t1.D, t2.E FROM t1 LEFT J
.net - 扩展/插件通信架构
一旦加载插件的问题得到解决(在 .NET 中通过 MEF 的情况下)，下一步要解决的是与它们的通信。简单的方法是实现一个接口(interface)，使用插件实现，但有时插件只需要扩展应用程序的工作方式

首页

博学

6Ren·AI

商城

algorithm - 为什么哈希表扩展通常通过将大小加倍来完成？