gpt4 book ai didi

Apache regex -301 重定向以消除 url 路径中的重复项

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:34:25 24 4
gpt4 key购买 nike

我们使用的 CMS 生成格式为 www.domain.com/home/help/contact/contact 的 URL。这里第一次出现的联系是目录,第二次出现是 HTML 页面本身。这些 URL 在 SEO 领域引起了问题。

我们已经实现了规范标签,但企业希望确保他们不会在搜索引擎和 Google 分析中遇到这些重复项,并要求我们在我们的网络服务器上实现 301 解决方案。

我的问题是我们有一个正则表达式来查找这些匹配项,但我还需要匹配项之前的 URL 部分。我们的正则表达式是 .*?([\w]+)\/\1+ 并且它返回 /home/help/contact/contact 中的 contact 。我怎样才能获得 /home/help/ 路径,以便我可以重定向到正确的页面?有人可以帮忙吗,因为我是正则表达式的初学者?

最佳答案

由于您可以使用匹配组获取联系人,因此也请将之前的所有内容包含在匹配组中:

(.*?)(/[\w]+)\2+

我也将 / 放在匹配组中,这样你就不会得到误报

    /home/some/app/page
this would be \1 ^ ^ found repetition (character p would be matched)

关于Apache regex -301 重定向以消除 url 路径中的重复项,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44297203/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com