gpt4 book ai didi

java - 删除除与正则表达式 java 匹配的内容之外的所有文本

转载 作者:太空宇宙 更新时间:2023-11-04 12:30:05 28 4
gpt4 key购买 nike

我有正则表达式,应该删除评论(是的,这很糟糕,但对我来说它有效)

String regex = (^\/\/.*)|(\s+\/\/.*)|((\/\*)(.|\n)+?(\*\/));

此代码应删除所有注释

Pattern.compile(regex).matcher(some text).replaceAll(" ");

但是我怎样才能删除除正则表达式之外的所有内容?

例如:如果我有这样的字符串:

/*评论很酷*/
公共(public)静态无效foo(){}

我的正则表达式匹配注释,但我需要删除不匹配的内容,所以它看起来像:

/*Comments it's cool*/

最佳答案

基本上,您可以只匹配正则表达式匹配的内容,然后连接匹配的文本。这要容易得多。

对于删除除原始模式匹配之外的所有内容的正则表达式,您可以考虑使用捕获可选组捕获整个模式,并使用 . 来匹配其后面的任何字符。

假设您的模式是 abc。它匹配abc。但现在,您需要匹配相反的内容,即您的正则表达式不匹配的所有内容。使用

(?s)(abc)?.

并替换为$1。请参阅regex demo

对于换行符可能需要进行一些调整。如果您不想删除换行符,请不要使用 DOTALL 修饰符。如果要使用它,请将原始模式中的 . 替换为 [^\n\r] 。请记住,您将能够使用某些 (\r?\n|\r){2,} 模式缩小空行(以及 $1 反向引用)。

所以,你的正则表达式是

String regex = "^\\s*//.*|/\*[^*]*\*+(?:[^/*][^*]*\*+)*/";

其中 /\*[^*]*\*+(?:[^/*][^*]*\*+)*/ 匹配多行注释,^\\s*//.* 匹配单行注释。

要使其删除除匹配内容之外的所有内容,请使用

String regex = "(?sm)(^\\s*//[^\r\n]*|/\\*[^*]*\\*+(?:[^/*][^*]*\\*+)*/)?.";

并替换为$1反向引用。请参阅regex demo (基于 ClasG demo )。请注意,我还为 ^ 添加了 (?m) MULTILINE 修饰符,以便在行的开头进行匹配。

关于java - 删除除与正则表达式 java 匹配的内容之外的所有文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37945614/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com