作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我有一个独特的情况,我需要即时生成哈希值。这是我的情况。这个问题与here有关.我需要在需要索引的数据库中存储许多 url。 URL 的长度可以超过 2000 个字符。数据库提示无法索引超过 900 字节的字符串。我的解决方案是使用 MD5 或 SHA256 对 URL 进行哈希处理。我不确定要使用哪种哈希算法。这是我的要求
我不担心安全问题。我担心字符长度、速度和碰撞。有人知道一个好的算法吗?
最佳答案
在您的情况下,我不会使用任何加密散列函数(即 MD5、SHA),因为它们在设计时就考虑到了安全性:它们主要是想让找到两个不同的字符串变得尽可能困难相同的哈希值。我认为这对您来说不是问题。 (当然,随机 冲突的可能性是散列所固有的)
我强烈不建议使用String.GetHashCode()
,因为实现未知,MSDN 表示它可能因框架的不同版本而异.即使 x86 和 x64 版本之间的结果也可能不同。因此,当您尝试使用较新(或不同)版本的 .NET 框架访问同一数据库时,您会遇到麻烦。
我在维基百科(here)上找到了hashCode
的Java实现算法,看起来很容易实现。即使是直接的实现也会比 MD5 或 SHA imo 的实现更快。您还可以使用 long
值来降低冲突的可能性。
还有对 .NET GetHashCode
实现的简短分析 here (不是算法本身,而是一些实现细节),我猜你也可以使用这个。 (或者尝试以类似的方式实现Java版本......)
关于c# - 如何快速散列 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7809817/
我是一名优秀的程序员,十分优秀!