gpt4 book ai didi

java - 为什么 Pattern.pattern() 不嵌入标志?

转载 作者:塔克拉玛干 更新时间:2023-11-02 08:36:09 25 4
gpt4 key购买 nike

我最近一直在研究正则表达式并注意到了这一点。

Pattern pNoEmbed = Pattern.compile("[ a-z]+", Pattern.CASE_INSENSITIVE);
Pattern pEmbed = Pattern.compile("(?i)[ a-z]+");

这是应该返回模式字符串的 pattern() 方法的输出。 toString() 似乎返回相同的东西。

两者都不区分大小写,所以为什么第一个没有(?i)
如果我想要它,除了 "(?i)"+ pattern 之外,我该如何获得它?

System.out.println(pNoEmbed.pattern()); // [ a-z]+
System.out.println(pEmbed.pattern()); // (?i)[ a-z]+

为了理智,两者都匹配得很好。

String s = "hello World";
System.out.println(pNoEmbed.matcher(s).matches()); // true
System.out.println(pEmbed.matcher(s).matches()); // true

(使用 Java 8 测试)


更清晰:

我想将一个正则表达式嵌入到另一个正则表达式中

Pattern p1 = Pattern.compile("[ a-z]+", Pattern.CASE_INSENSITIVE);
Pattern p2 = Pattern.compile(p1.pattern() + "\\s+");

一个不好的例子,因为我知道我可以做到这一点

Pattern p2 = Pattern.compile(p1.pattern() + "\\s+", p1.flags());

但是,基本上,我希望 p2.pattern() 成为 "(?i)[ a-z]+\\s+"

最佳答案

Both have case-insensitivity, so why no (?i) in the first one?

最直接,因为Pattern.pattern()

Returns the regular expression from which this pattern was compiled.

我想这回避了一个问题,即为什么没有一个额外的或不同的方法返回一个正则表达式字符串,该字符串表示原始正则表达式和应用的标志的组合。只有推测性的答案是可能的,但我观察到

  • Pattern 还有一个 flags() 方法,通过它可以检索标志。将其与 pattern() 一起使用,可以编译一个与原始文件有效相同的新 Pattern前提是该模式不修改标志全局(有关此资格的更多信息,请参阅问题评论)。

  • 可以想象,Pattern 用户可以区分合并到正则表达式字符串中的标志和作为标志单独传递的标志。

And if I wanted it, how would I get it other than "(?i)" + pattern?

据我所知,没有内置机制可以获取您想要的正则表达式字符串。但是,您可以在 Pattern.flags() 的帮助下构建这样的机制。不过,这种机制的基本操作模式可能与您介绍的没有太大区别。

关于java - 为什么 Pattern.pattern() 不嵌入标志?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42122737/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com