gpt4 book ai didi

php - 哪个是比较两个 url 的最好和最快的方法?

转载 作者:可可西里 更新时间:2023-11-01 07:33:51 27 4
gpt4 key购买 nike

我有两个表,其中包含从不同来源获取的 url 列表。

我想找到共同的条目并将它们放在单独的表中。

这就是我正在做的:

  1. 在获取它们时找到 url 的 md5 散列。
  2. 将它们存储在一列中。
  3. 我将一个表作为一个数组获取,在其中运行一个循环,然后插入另一个表中的值,其中 md5 散列值相同。

编辑:我应该去除“http://”和“www.”的网址吗?

我想知道任何其他更好更快的方法,我可以使用它来执行上述操作。

我正在使用 PHP + MySQL

最佳答案

如果您需要真正的速度,MD5 会有点慢。尝试 MurmurHash

你应该在哈希计算之前做以下转换:

  • 去除“http://”和 www。
  • 去除尾部斜杠
  • 规范化 URL(urlencode)

关于php - 哪个是比较两个 url 的最好和最快的方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2409992/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com