gpt4 book ai didi

c# - 如何快速散列 URL

转载 作者:太空狗 更新时间:2023-10-29 20:40:22 25 4
gpt4 key购买 nike

我有一个独特的情况,我需要即时生成哈希值。这是我的情况。这个问题与here有关.我需要在需要索引的数据库中存储许多 url。 URL 的长度可以超过 2000 个字符。数据库提示无法索引超过 900 字节的字符串。我的解决方案是使用 MD5 或 SHA256 对 URL 进行哈希处理。我不确定要使用哪种哈希算法。这是我的要求

  • 最小冲突的最短字符长度
  • 需要非常快速。我将对每个页面请求的 referurl 进行哈希处理
  • 冲突需要最小化,因为我的数据库中可能有数百万个 url

我不担心安全问题。我担心字符长度、速度和碰撞。有人知道一个好的算法吗?

最佳答案

在您的情况下,我不会使用任何加密散列函数(即 MD5、SHA),因为它们在设计时就考虑到了安全性:它们主要是想让找到两个不同的字符串变得尽可能困难相同的哈希值。我认为这对您来说不是问题。 (当然,随机 冲突的可能性是散列所固有的)

强烈不建议使用String.GetHashCode(),因为实现未知,MSDN 表示它可能因框架的不同版本而异.即使 x86 和 x64 版本之间的结果也可能不同。因此,当您尝试使用较新(或不同)版本的 .NET 框架访问同一数据库时,您会遇到麻烦。

我在维基百科(here)上找到了hashCode的Java实现算法,看起来很容易实现。即使是直接的实现也会比 MD5 或 SHA imo 的实现更快。您还可以使用 long 值来降低冲突的可能性。

还有对 .NET GetHashCode 实现的简短分析 here (不是算法本身,而是一些实现细节),我猜你也可以使用这个。 (或者尝试以类似的方式实现Java版本......)

关于c# - 如何快速散列 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7809817/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com