- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试为我将散列到字典中的某个对象创建自定义散列函数。散列函数是唯一的(不是标准的 Python 函数)。这对我来说非常重要:使用独特的功能。每个键的值都是一个列表。
假设我重写了 __hash__
并最终得到了对象的正确哈希值。会:
dict = {}
dict[number_here] = value
将值散列到位置编号 number_here
中,还是它仍然位于 Python 的散列表将为该数字计算的位置?
打印 dict
只显示项目而不是它们所在的位置。但是,当我执行 hash(4)
时,结果是 4。所以我假设这意味着整数被散列到它们各自的位置?
如果我错了,有人可以验证我的发现或向我解释吗?
最佳答案
python dict
实现使用散列值来基于键稀疏地存储值并避免在该存储中发生冲突。它使用 hash()
的结果作为起点,它不是最终位置。
因此,尽管 hash(4)
返回 4
,但底层 C 结构中的确切“位置”也基于其他键已经存在,以及当前表有多大。例如,python 哈希表会根据需要调整大小(添加项目)。
由于 dict 没有顺序,这不是您需要担心的事情,也不希望影响它。如果您需要在字典中排序,请改用 collections.OrderedDict()
实现,它会单独跟踪排序。
您可能想阅读哈希表如何在 Wikipedia 上工作; Python 在其实现中使用开放寻址。
在表中选择槽时,取哈希值(整数)与当前表大小的模,因此在大小为32的表上,所以键45
,hash值 45
最初将存储在插槽 14 中。
如果发生冲突(插槽 14 中已经存储了其他内容,并且不是整数 45
),则插槽值扰动直到出现空插槽找到或找到相同的 key 。扰动是用公式完成的:
perturb = slot = hash
while slot_is_full and item_in_slot_is_not_equal_to_key:
slot = (5*slot) + 1 + perturb
perturb >>= 5
因此,当发生冲突时,会以逐渐变小的步长选择另一个插槽,直到它扫描整个表格。请注意,如果需要,表格已经调整大小以腾出空间。
为了使其正常工作,自定义类型需要 __hash__()
方法和需要实现__eq__()
以确定两个实例是否代表相同的键。匹配哈希值是不够的。要让 dict
实现考虑两个实例来表示完全相同的键,它们的哈希值必须匹配,并且它们必须为 ==
相等运算符返回 True。这些对象被认为是 hashable .
(对于 Python 2.x,实现 __cmp__()
hook 可以代替实现 __eq__()
;在 Python 3 中已删除对此的支持)。
关于python - 在字典中覆盖 Python 的哈希函数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13514716/
我知道 C++ 中的 overriding 是什么。但是,是否存在覆盖?如果有,是什么意思? 谢谢。 最佳答案 在 C++ 术语中,您有 覆盖(与类层次结构中的虚拟方法相关)和 重载(与具有相同名称但
我想捕获位于另一个元素下的元素的鼠标事件。 这是我所拥有的示例:http://jsfiddle.net/KVLkp/13/ 现在我想要的是当鼠标悬停在红色方 block 上时蓝色方 block 有黄色
以下报道 here我尝试创建一个带有重叠散点图的箱线图。 但是当我运行时: In [27]: table1.t_in[table1.duration==6] Out[27]: counter 7
有一个 JS Fiddle here , 你能在不克隆到新对象的情况下替换 e.target 吗? 下面重复了那个 fiddle 的听众; one.addEventListener('click',
首先要解决重复的可能性: 我不是询问 Override 是什么、它的含义或 @Override 在 java 文档注释之外。那是我不是问 /**Some JavaDoc Comment*/ @over
我想要高于定义的数组。它存储点及其坐标。 public static List simpleGraph(List nodes) { int numEdges = nodes.size() *
我在 http://olisan.dk/blog/ 有一个博客- 如您所见,有一个 28 像素的高间隙(边距顶部)...在 style.css 中: margin-top: 0; 也被设置为 marg
Vulkan 句柄是指向 struct 的不透明指针,或者只是无符号的 64 位整数,具体取决于 VK_USE_64_BIT_PTR_DEFINES 的值: #if (VK_USE_64_BI
我正在尝试提供一个行为类似于 DataGridTextColumn 的 DataGrid 列,但在编辑模式下有一个附加按钮。我查看了 DataGridTemplateColumn,但似乎更容易将 Da
使用 Django 1.10 我想在用户名中允许\字符,因为我在使用“django.contrib.auth.middleware.RemoteUserMiddleware”的 Windows 环境中
我正在尝试使用 ffmpeg 将 Logo 放入 rtmp 流中。我的 ffmpeg 版本是 ffmpeg version 4.3.1目前在我的复杂过滤器中,我有: ffmpeg -re -i 'v
是否有用于Firebase 3存储的方法/规则来禁用文件更新或覆盖? 我为数据库找到了data.exists(),但没有为存储找到解决方案。 最佳答案 TL; DR:在Storage Security
我有两个 Docker Compose 文件,docker-compose.yml看起来像这样 version: '2' services: mongo: image: mongo:3.2
我需要覆盖 JPA 中的集合表吗?也许有人有想法 public class nationality{ @Embedded @AttributeOverrides({
嗨,我正在使用 WIX 和下面的代码将文件安装到目录中。 我的应用程序的工作方式是用户可以在该目录中复制他们自己的文件,覆盖他们喜欢的内容
我正在尝试为 Lua 中的字符串实现我自己的长度方法。 我已成功覆盖字符串的 len() 方法,但我不知道如何为 # 运算符执行此操作。 orig_len = string.len function
在Scala 2.10.4中,给出以下类: scala> class Foo { | val x = true | val f = if (x) 100 else 200
我想做上面的事情。 我过去覆盖了许多文件...... block ,模型,助手......但这个让我望而却步。 谁能看到我在这里做错了什么: (我编辑了这段代码......现在包括一些建议......
根据javadoc An instance method in a subclass with the same signature (name, plus the number and the ty
我有一段代码,只要有可用的新数据作为 InputStream 就会生成新数据。每次都覆盖同一个文件。有时文件在写入之前变为 0 kb。 Web 服务会定期读取这些文件。我需要避免文件为 0 字节的情况
我是一名优秀的程序员,十分优秀!