gpt4 book ai didi

performance - 在键值存储中使用哈希作为 ID

转载 作者:行者123 更新时间:2023-12-02 01:36:47 24 4
gpt4 key购买 nike

我想知道在像 Hazelcast 这样的键值存储中使用哈希(CityHash、Murmur 等)作为键是否是个好主意。我希望数据库中有大约 2,000,000,000 条记录 (URL),因此可能会发生冲突。通过散列冲突丢失一些数据并不是特别重要,但当然最好避免它们。

一条记录包含URL、时间戳、状态码。主要操作是插入和查找一个URL是否已经存在。

那么,如果速度是相关的,你会建议什么:

  • 使用ID generator , 或
  • 使用像 CityHash 或 Murmur 这样的哈希算法,或者
  • 使用相关字符串,在本例中是 URL 本身?

最佳答案

Hazelcast 不依赖于键对象的 hashCode/equals 方法,而是使用键的二进制表示的 MurMur 哈希。

简而言之,您真的不必担心散列冲突。

关于performance - 在键值存储中使用哈希作为 ID,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30761792/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com