gpt4 book ai didi

algorithm - 使用 min-hash 实现局部敏感散列

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:40:20 24 4
gpt4 key购买 nike

我阅读了很多使用最小哈希实现 LSH(局部敏感哈希)的教程、文档和代码片段。

LSH 尝试通过散列随机子集并聚合这些子集来找到两个集合的 Jaccard 系数。我查看了 code.google.com 中的实现,但也无法理解他们的方法。我看懂论文Google news personalization: scalable online collaborative filtering ,但我无法理解其中的任何实现。

有人可以用简单的语言向我解释如何使用 MinHash 实现 LSH 吗?

最佳答案

您想实现最小哈希算法,但不是 LSH 本身。最小散列一种 LSH 技术。因此,一般来说,LSH 并不近似于 Jaccard 系数,而最小散列的特定方法却可以。

简介在Mining of Massive Datasets, Chapter 3 by Anand Rajaraman and Jeff Ullman中给出.

关于algorithm - 使用 min-hash 实现局部敏感散列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14204102/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com