gpt4 book ai didi

url-rewriting - 如何用 Nginx 将下划线替换为破折号

转载 作者:行者123 更新时间:2023-12-05 08:15:08 26 4
gpt4 key购买 nike

我是第一次使用 Nginx,对它几乎一无所知。

我需要将 100 多个 URL 中的“_”替换为“-”。我想一定有一种简单的方法可以用 Nginx 做到这一点,但在谷歌上找不到任何东西。

谢谢!

编辑:

我的网址例如:http://www.mywebsite.com/this_category/page1.php

我需要这个变成:http://www.mywebsite.com/this-category/page1.php

最佳答案

不,没有一种简单的方法可以做到这一点,但是重写引擎仍然可以被强制执行它,假设您可以对需要转换的破折号的数量设置一个合理的上限一个 url(或者即使你不这样做,请参阅答案的末尾。)

这是我的做法(经过测试的代码):

rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5-$6-$7-$8-$9;
rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5;
rewrite ^([^_]*)_([^_]*)_(.*)$ $1-$2-$3;
rewrite ^([^_]*)_(.*)$ $1-$2;

这四次重写分别将 url 中的前 8、4、2 和 1 个下划线转换为破折号。每条规则中的下划线数量是有意递减的 2 次方。此 block 是最有效的规则集,将在单个 url 中从 0 到 15 次出现的下划线进行转换,使用匹配或不匹配每个单独规则的所有 16 种组合。

您还会注意到,我在每条规则中对除最后一组以外的每个组都使用了 [^_]*。这避免了正则表达式引擎在不匹配的情况下执行不必要的回溯。基本上,在正则表达式中有九颗通用星 .* 会导致 O(n9) 在“最坏情况”下的复杂性(这是非常糟糕的),这是不匹配的,这实际上是您最常见的情况。 (对于那些希望真正了解底层库实际执行正则表达式的人,我可以推荐 this book。)

出于这个原因,如果您可以将破折​​号的数量限制在 15 个以下,我建议取消第一条或前两条规则。仅最后三个规则就可以翻译最多 7 个下划线;最后两个将翻译最多 3 个。

最后,您没有提到将用户重定向到新网址。 (与仅在带下划线的 url 和正确的 url 处提供内容相反,这通常会被搜索引擎疯子皱眉。仅供引用。)如果这就是您所需要的,您将不得不将这些重写放入一个特殊的在 url 中存在下划线时触发的位置,并在四次重写结束时将用户重定向到新 url:

location ~ _ {
rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5-$6-$7-$8-$9;
rewrite ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ $1-$2-$3-$4-$5;
rewrite ^([^_]*)_([^_]*)_(.*)$ $1-$2-$3;
rewrite ^([^_]*)_(.*)$ $1-$2;
rewrite ^ $uri permanent;
}

这也增加了在单个 url 中翻译无限数量的下划线的好处,代价是将更多的下划线重定向到用户的浏览器。

HTH;-P

关于url-rewriting - 如何用 Nginx 将下划线替换为破折号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15912191/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com