gpt4 book ai didi

java - 如何正则表达式匹配对内的对

转载 作者:行者123 更新时间:2023-11-30 09:30:29 25 4
gpt4 key购买 nike

我的问题很简单,即使它的目的很复杂。我将使用一个简单的例子:

AzzAyyAxxxxByyBzzB

所以通常我想要获取 AB 之间的所有内容。但是,由于第一个 A 和最后一个 B(一对)之间的某些内容包含额外的 AB 对,因此我需要将比赛结束。 (不确定最后一部分是否有意义)。

所以我正在寻找的是一些 RegEx,它可以让我获得以下输出:

Match 1
Group 1: AzzAyyAxxxxByyBzzB
Group 2: zzAyyAxxxxByyBzz

然后再匹配一次得到:

Match 2
Group 1: AyyAxxxxByyB
Group 2: yyAxxxxByy

然后终于再次得到:

Match 3
Group 1: AxxxxB
Group 2: xxxx

显然,如果我对整个输入尝试 (A(.*?)B),我会得到:

Match x
Group 1: AzzAyyAxxxxB
Group 2: zzAyyAxxxx

这不是我要找的:)

我希望这是有道理的。我知道这是否不能在 RegEx 中完成,但我想在我放弃它并尝试其他方法之前我会问问你们中的一些正则表达式向导。谢谢!

附加信息:

我正在从事的项目是用 Java 编写的。

另一个问题是我正在解析一个可能包含如下内容的文档:

AzzAyyAxxxxByyBzzB
Here is some unrelated stuff
AzzAyyAxxxxByyBzzB
AzzzBxxArrrBAssssB

顶部的AB 对需要与底部的AB 对分开

最佳答案

您使用 ? 使您的正则表达式显式不贪婪。只需将其排除在外,正则表达式将在匹配 B 之前尽可能多地消耗:

(A(.*)B)

但是,一般来说,嵌套结构超出了正则表达式的范围。在这种情况下:

AxxxByyyAzzzB

您现在还可以匹配从第一个 A 到最后一个 B。如果这在您的场景中可行,您最好自己逐个字符地检查字符串并计算 AB 以确定哪些属于在一起。

编辑:

现在您已经更新了问题并且我们在评论中解决了这个问题,您确实遇到了多个连续对的问题。在这种情况下,这无法使用不支持递归的正则表达式引擎来完成。

但是您可以切换到从内到外的匹配。

A([^AB]*)B

这只会得到最里面的对,因为分隔符之间既不能有 A 也不能有 B。如果找到它,则可以删除该对并继续下一场比赛。

关于java - 如何正则表达式匹配对内的对,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13260923/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com