- mongodb - 在 MongoDB mapreduce 中,如何展平值对象?
- javascript - 对象传播与 Object.assign
- html - 输入类型 ="submit"Vs 按钮标签它们可以互换吗?
- sql - 使用 MongoDB 而不是 MS SQL Server 的优缺点
在 C/C++/Java/C# 中有没有相对容易理解(并且易于实现)的局部敏感哈希示例?
我想了解更多关于这个概念的信息,所以想在几个文本文件上尝试一个实现,只是为了看看它是如何工作的,所以我不需要任何高性能或任何东西......只是一个例子一个散列函数,它为相似的输入返回相似的散列。之后我可以通过示例从中学到更多。 :)
最佳答案
对于字符串,您可以使用近似匹配算法。
如果字符串与引用字符串等距,那么它们很可能彼此相似。这样你就有了一个字符串的局部敏感哈希实现。
您可以为一系列距离创建不同的哈希桶。
编辑:您可以尝试其他的字符串距离变化。一个更简单的算法只会返回 no。两个字符串之间的公共(public)字符。
关于c# - 局部敏感哈希实现?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5769949/
我这里有一些(遗留)代码,似乎在LD_LIBRARY_PATH上调用setenv(其值在编译时未知,实际上它将从命令中获取)行),现在我必须将其移植到 Windows。我怀疑 setenv 只是出于历
我在 SSIS 包上有一个敏感字符串参数,用于存储远程服务器的密码。 但是,当字符串值包含花括号时,作业代理会在配置该步骤的包参数时抛出错误: Microsoft SQL Server Managem
我们都非常了解 strictfp 的工作原理。 像这样: package com.hk.basicjava.tests.strictfp; import java.util.*; public cla
我正在对我的博客进行简单搜索。我使用亚美尼亚语,当我搜索时,这些字母总是很敏感。这是我的代码的一部分。提前谢谢你。 search_query = get.get('search') query_lis
我正在对我的博客进行简单搜索。我使用亚美尼亚语,当我搜索时,这些字母总是很敏感。这是我的代码的一部分。提前谢谢你。 search_query = get.get('search') query_lis
想象一下这个非常基本的可拖放设置: #dropArea 是可放置的。 #itemBox > .item 是可拖动对象。 由于某种原因,droppable
我有这样的网址: http://quickstart.local/public/category1/product2 并且在 url (category1/product2) 数字是 id ,从数据库
我是一名优秀的程序员,十分优秀!