作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的问题很简单,即使它的目的很复杂。我将使用一个简单的例子:
AzzAyyAxxxxByyBzzB
所以通常我想要获取 A
和 B
之间的所有内容。但是,由于第一个 A
和最后一个 B
(一对)之间的某些内容包含额外的 AB
对,因此我需要将比赛结束。 (不确定最后一部分是否有意义)。
所以我正在寻找的是一些 RegEx,它可以让我获得以下输出:
Match 1
Group 1: AzzAyyAxxxxByyBzzB
Group 2: zzAyyAxxxxByyBzz
然后再匹配一次得到:
Match 2
Group 1: AyyAxxxxByyB
Group 2: yyAxxxxByy
然后终于再次得到:
Match 3
Group 1: AxxxxB
Group 2: xxxx
显然,如果我对整个输入尝试 (A(.*?)B)
,我会得到:
Match x
Group 1: AzzAyyAxxxxB
Group 2: zzAyyAxxxx
这不是我要找的:)
我希望这是有道理的。我知道这是否不能在 RegEx 中完成,但我想在我放弃它并尝试其他方法之前我会问问你们中的一些正则表达式向导。谢谢!
附加信息:
我正在从事的项目是用 Java 编写的。
另一个问题是我正在解析一个可能包含如下内容的文档:
AzzAyyAxxxxByyBzzB
Here is some unrelated stuff
AzzAyyAxxxxByyBzzB
AzzzBxxArrrBAssssB
顶部的AB
对需要与底部的AB
对分开
最佳答案
您使用 ?
使您的正则表达式显式不贪婪。只需将其排除在外,正则表达式将在匹配 B
之前尽可能多地消耗:
(A(.*)B)
但是,一般来说,嵌套结构超出了正则表达式的范围。在这种情况下:
AxxxByyyAzzzB
您现在还可以匹配从第一个 A
到最后一个 B
。如果这在您的场景中可行,您最好自己逐个字符地检查字符串并计算 A
和 B
以确定哪些属于在一起。
编辑:
现在您已经更新了问题并且我们在评论中解决了这个问题,您确实遇到了多个连续对的问题。在这种情况下,这无法使用不支持递归的正则表达式引擎来完成。
但是您可以切换到从内到外的匹配。
A([^AB]*)B
这只会得到最里面的对,因为分隔符之间既不能有 A
也不能有 B
。如果找到它,则可以删除该对并继续下一场比赛。
关于java - 如何正则表达式匹配对内的对,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13260923/
我是一名优秀的程序员,十分优秀!