gpt4 book ai didi

python - Class Custom __eq__ 作为哈希的比较

转载 作者:太空宇宙 更新时间:2023-11-04 00:03:42 25 4
gpt4 key购买 nike

考虑一个自定义类:

class MyObject:
def __init__(self, a, b):
self.a = a
self.b = b

def __hash__(self):
return hash((self.a, self.b))

def __eq__(self, other):
if isinstance(other, self.__class__):
return self.__hash__() == other.__hash__()

让相等性依赖于散列是个坏主意吗?这似乎是一种更优雅和可读性更高的机制,而不是以零碎的方式检查每对属性以获取更多属性 ala

self.a == other.a and self.b == other.b and ... self.n == other.n

或使用 getattr 和列表进行更动态的检查(是否有更好的方法来比较大量的属性对?)

内置散列函数返回的散列大小是否不够大,在相对较大的数据集中不可靠?

最佳答案

是的,这是个坏主意。哈希值不是唯一的,具有相同哈希值的对象保证实际上也相等:

>>> (-1, 0) == (-2, 0)
False
>>> hash((-1, 0)) == hash((-2, 0))
True

哈希值并不意味着是唯一的;它们是在有限尺寸中挑选插槽的一种方式 hash table快速,以促进 O(1) 字典查找,并且允许和预期发生冲突

是的,Python 要求相等的对象应该具有相等的哈希值,但这并不意味着关系可以颠倒。

我只是比较元组:

def __eq__(self, other):
return (self.a, self.b) == (other.a, other.b)

如果您正在编写大量数据类,所有都需要相等性测试和哈希等的简单类,请使用 dataclasses module (Python 3.7 或更高版本,或使用 backport ):

from dataclasses import dataclass

@dataclass(frozen=True)
class MyObject:
a: int
b: int

上面的类现在带有一个 __hash____equals__ 方法:

>>> MyObject(-1, 0) == MyObject(-2, 0)
False
>>> hash(MyObject(-1, 0)) == hash(MyObject(-2, 0))
True
>>> MyObject(42, 12345) == MyObject(42, 12345)
True

关于python - Class Custom __eq__ 作为哈希的比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54944398/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com