gpt4 book ai didi

Java 正则表达式模式匹配器 - 如何允许选择?

转载 作者:行者123 更新时间:2023-12-01 23:40:21 25 4
gpt4 key购买 nike

在 Java 中,我有一个处理 Apache Web 服务器日志并检查 URL 扩展类型的代码块。当 URL 的格式为“/index.html”时效果很好,但偶尔 URL 为“/”时,会破坏代码。

下面的代码工作正常,但如果在输入行中“/index.html”更改为“/”,那么它将中断,因为第 19 行 (\\.\\S*)检查点后跟几个字符,但如果 URL 是“/”,则正则表达式找不到点。

如何重写第 19 行 (\\.\\S*) 以允许选择 .extension 或“/”?

换句话说:
如果 URL=index.html,则扩展名为 .html
如果 URL=index.php,则扩展名为 .php
如果 URL=/,则扩展名是“”

import java.util.regex.*;

public class Test {

public static void main(String[] args) {

String log_input = "123.45.67.89 - - [27/Oct/2000:09:27:09 -0400] \"GET /index.html HTTP/1.0\" 200 10450 \"-\" \"Mozilla/4.6 [en] (X11; U; OpenBSD 2.8 i386; Nav)\"";
//String log_input = "123.45.67.89 - - [27/Oct/2000:09:27:09 -0400] \"GET / HTTP/1.0\" 200 10450 \"-\" \"Mozilla/4.6 [en] (X11; U; OpenBSD 2.8 i386; Nav)\"";

//step 1 - split log line
Pattern p = Pattern.compile("^([\\d.]+) (\\S+) (\\S+) \\[([\\w:/]+\\s[+\\-]\\d{4})\\] \"(.+)\" (\\d{3}) (\\d+) \"([^\"]+)\" \"([^\"]+)\"");
Matcher m = p.matcher(log_input);
m.matches();
String request_ip = m.group(1);
String request_resource = m.group(5);
System.out.println("Input: " + m.group(5));

//step 2 - check file extension
Pattern p2 = Pattern.compile(".* .*(\\.\\S*) .*");
Matcher m2 = p2.matcher(request_resource);
m2.matches();
String request_resource_ext = m2.group(1);
System.out.println("Extension: " + request_resource_ext);

if(request_resource_ext.matches("\\.htm|\\.html|\\.php|^$")){ //^$ in case the URL is / which has no extension
System.out.println("Write");
}else{
System.out.println("Do not write");
}

}

}

最佳答案

使用以下正则表达式:

.* (?:/|.*(\\.\\S*)) .*

它使用管道|字符来匹配/在某处带有点的文件名。

?: 使组不被捕获,以便 m2.group(1) 继续像以前一样工作。

关于Java 正则表达式模式匹配器 - 如何允许选择?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18049202/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com