gpt4 book ai didi

迁移网站时匹配重定向 URL 的算法

转载 作者:塔克拉玛干 更新时间:2023-11-03 06:14:10 25 4
gpt4 key购买 nike

假设我们有两组 URL:源池目标池。源池基本上是网站上存在的 URL 的平面列表,而目标池包含同一网站的重制版本的所有 URL。因此对于源池中的大多数条目,目标池中应该有对应的、相似的条目。

我们希望通过将目标池 中的一个 URL 与源池 中的每个 URL 进行匹配来创建一个重定向映射。同一个目标可以映射到多个

示例源池:

/books/faust
/books/romeo-and-juliet
/ebooks/from-zero-to-hero
/blog
/about-us
/deprecated-page

示例目标池:

/books/goethe/faust
/books/shakespeare/romeo-and-juliet
/ebooks/random-wannabe/from-zero-to-hero
/blog
/about-us
/newly-added-page

注意:您的回答不应该针对所提供的示例过于具体,例如添加作者命名空间。相反,假设只有两组基于字符串的 pretty urls具有不同的重叠/相似性。我们正在寻找一种通用解决方案,以根据两个 URL 引用同一事物的可能性来创建重定向映射。

那么问题来了:

  1. 是否有针对此应用程序的现成解决方案(用于网站迁移的重定向),采用两个 url 列表并返回一个映射?
  2. 如果不是,哪些通用算法适合从列表中选出一个最有可能的候选人?

匹配概率的额外输出将有助于稍后手动检查列表。

最佳答案

好吧,回答我自己的问题:

  1. 与此同时,一款专为该应用程序设计的工具已经上线。可以在这里找到:https://github.com/jsphpl/redirect-mapper
  2. 对于我目前的申请,Levenshtein distance事实证明已经是一个很好的相似指标,但可能并非在所有情况下都适用。理论上,您可以使用任何现有的 String metric或构建您自己的最适合您当前需求的算法。

关于迁移网站时匹配重定向 URL 的算法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43680963/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com