gpt4 book ai didi

java - 使用正则表达式从字符串中删除可选编号

转载 作者:行者123 更新时间:2023-12-02 00:04:52 25 4
gpt4 key购买 nike

我尝试创建一个正则表达式来捕获两个捕获组之间的 token 。

输入示例

Added experiencevalidator [Java] [Spring]
1. Added validators [Java] [Spring]
2. Fixed issues with deletes [JPA] [Java]

基本上我想捕获编号(1.,2.)和标签([Java] [Spring])之间的标记。

预期捕获

匹配器应该为每一行返回以下内容:

Added experiencevalidator
Added validators
Fixed issues with deletes

我目前正在使用此代码,它利用正向前瞻和后向查找。

private Pattern TITLE_REGEX = Pattern.compile("(?<=\\d\\.\\s)(.*?)(?=\\[.*)");

private String cleanseTitle(String title){
Matcher m = TITLE_REGEX.matcher(title);
if(m.find()){
System.out.println("Match found");
System.out.println(m.group(1));;
}else{
System.out.println("No Match");
}
return title;
}

每一行都通过 title 参数传递给 cleanseTitle 方法。我的问题是我不确定如何处理前面没有编号的行。该代码当前可以正确处理前面有编号的行,但是那些前面没有编号的行将不匹配。

任何人都可以为我提供一个正则表达式来处理编号前面的行或前面没有编号的行吗?我对任何正则表达式解决方案持开放态度,并且我不喜欢当前的正则表达式,因此请随意更改它。任何可以帮助我了解更多有关正则表达式的附带解释也将受到赞赏。

最佳答案

由于您使用捕获组,因此不需要环视。我会将后向更改为交替,以匹配编号或前导可选空格:

^(?:\d+\.\s|\s*)(.*?)(?=\[.*)

查看here on Regexr

交替的顺序在这里很重要。您需要将编号作为第一个替换,因为第二个替换将始终匹配。

您还可以使用此跳过前瞻和惰性量词

^(?:\d+\.\s|\s*)([^\[]+)

查看here on Regexr

关于java - 使用正则表达式从字符串中删除可选编号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14086404/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com