gpt4 book ai didi

python - python 中的哈希函数族生成器

转载 作者:太空狗 更新时间:2023-10-29 21:44:45 26 4
gpt4 key购买 nike

我正在寻找一个哈希函数族生成器,它可以在给定一组参数的情况下生成一系列哈希函数。到目前为止我还没有找到任何这样的发电机。有没有办法用 hashlib 做到这一点?包?

例如我想做这样的事情:

h1 = hash_function(1)
h2 = hash_function(2)
...

h1h2将是不同的哈希函数。

对于那些可能知道的人,我正在尝试在非常大的数据集上实现最小哈希算法。

基本上,对于给定的文档,我有一组非常大的特征(1 亿到 10 亿),我需要为这组特征创建 1000 到 10000 个不同的随机排列。

我不想明确地构建随机排列,所以我想在下面使用的技术:

  1. 生成哈希函数h并考虑两个指数 rs
  2. r出现在 s 之前在排列中 if h(r) < h(s)并对 100 到 1000 个不同的哈希函数执行此操作。

是否有任何我可能错过的已知库?或者您可能知道的任何使用 Python 生成散列函数族的标准方法?

最佳答案

我会做类似的事情(如果您不需要线程安全——如果您确实需要线程安全则不难改变——并假设是 32 位 Python 版本):

import random

_memomask = {}

def hash_function(n):
mask = _memomask.get(n)
if mask is None:
random.seed(n)
mask = _memomask[n] = random.getrandbits(32)
def myhash(x):
return hash(x) ^ mask
return myhash

关于python - python 中的哈希函数族生成器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2255604/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com