gpt4 book ai didi

java - 根据 RFC 3986 的无效 URI 示例

转载 作者:塔克拉玛干 更新时间:2023-11-02 18:58:59 25 4
gpt4 key购买 nike

对于我的单元测试,我想找到一个无效 URI 的示例,它将无法匹配来自 Spring MVC 3.1.1 的 UriComponentsBuilder#URI_PATTERN 正则表达式:

private static final String SCHEME_PATTERN = "([^:/?#]+):";

private static final String HTTP_PATTERN = "(http|https):";

private static final String USERINFO_PATTERN = "([^@/]*)";

private static final String HOST_PATTERN = "([^/?#:]*)";

private static final String PORT_PATTERN = "(\\d*)";

private static final String PATH_PATTERN = "([^?#]*)";

private static final String QUERY_PATTERN = "([^#]*)";

private static final String LAST_PATTERN = "(.*)";

// Regex patterns that matches URIs. See RFC 3986, appendix B
private static final Pattern URI_PATTERN = Pattern.compile(
"^(" + SCHEME_PATTERN + ")?" + "(//(" + USERINFO_PATTERN + "@)?" + HOST_PATTERN + "(:" + PORT_PATTERN +
")?" + ")?" + PATH_PATTERN + "(\\?" + QUERY_PATTERN + ")?" + "(#" + LAST_PATTERN + ")?");

我正在努力寻找一个会导致 UriComponentsBuilder.fromUriString()IllegalArgumentException 而失败的字符串。我尝试的任何内容都作为有效 URI 通过了正则表达式检查。

最佳答案

我想任何东西都会匹配那个正则表达式。问题是正则表达式没有严格执行 RFC。相反,它被设计为宽容的;即接受任何旧垃圾并尽最大努力将其解析为 URL。

(但是,我注意到它在解析非 HTTP URI 方面做得不好。看看 SCHEME_PATTERN ... 哭吧。)

如果您想对 URI 进行严格的解析或验证,最好使用 java.net.URI。正则表达式不是完成此任务的正确工具。

关于java - 根据 RFC 3986 的无效 URI 示例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9460159/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com