- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在使用正则表达式,并且想在Java中String类的replaceAll
方法上使用它。
我的正则表达式可以正常工作,并且groupCount()
返回11。因此,当我尝试使用指向第11个组的后向引用替换文本时,我得到的第一个组带有附加的“ 1”,而不是第11个组。
String regex = "(>[^<]*?)((\+?\d{1,4}[ \t\f\-\.](\d[ \t\f\-\.])?)?(\(\d{1,4}([\s-]\d{1,4})?\)[\.\- \t\f])?((\d{2,6}[\.\- \t\f])+\d{2,6})|(\d{6,16})([;,\.]{1,3}\d{3,}#?)?)([^<]*<)";
String text = "<span style=\"font-size:11.0pt\">675-441-3144;;;78888464#<o:p></o:p></span>":
String replacement = text.replaceAll(regex, $1<a href="tel:$2">$2</a>$11");
<span style=\"font-size:11.0pt\"><a href=\"tel:675-441-3144;;;78888464#\">675-441-3144;;;78888464#</a><o:p></o:p></span>
<span style="font-size:11.0pt"><a href="tel:675-441-3144">675-441-3144</a>>1o:p></o:p></span>
最佳答案
简短答案
在替换中,您访问比赛第11组的方式是使用$11
。
说明:
如corresponding Javadoc *所述:
替换字符串可能包含对捕获的子序列的引用
在上一场比赛中:每次出现${name}
或$g
替换为评估相应group(name)的结果,或者
group(g)。对于$g
,在$
之后的第一个数字始终是
视为组参考的一部分。随后的数字是
如果它们构成法律组参考,则合并到g
中。
因此,一般来讲,只要至少有11个组,"$11"
的值就会为group(11)
。但是,如果您没有至少11个组,则"$11"
将计算为group(1) + "1"
。
*此引用来自Matcher#appendReplacement(StringBuffer,String)
,这是来自String#replaceAll(String,String)
的相关引用链的链接。
实际答案
您的正则表达式不会执行您认为的操作。
第1部分
问题
让我们将正则表达式分为三个顶级组。这些分别是组1、2和11。
第一组:(>[^<]*?)
第2组:((\+?\d{1,4}[ \t\f\-\.](\d[ \t\f\-\.])?)?(\(\d{1,4}([\s-]\d{1,4})?\)[\.\- \t\f])?((\d{2,6}[\.\- \t\f])+\d{2,6})|(\d{6,16})([;,\.]{1,3}\d{3,}#?)?)
第11组:([^<]*<)
第2组是您的正则表达式的主体,它由两个选项的顶级交替组成。这两个选项分别由3-8组和9-10组组成。
第一种选择:((\+?\d{1,4}[ \t\f\-\.](\d[ \t\f\-\.])?)?(\(\d{1,4}([\s-]\d{1,4})?\)[\.\- \t\f])?((\d{2,6}[\.\- \t\f])+\d{2,6})
第二种选择:(\d{6,16})([;,\.]{1,3}\d{3,}#?)?)
现在,给出text
字符串,这是怎么回事:
组1执行。它匹配第一个">"
。
第2组执行。它按顺序评估其交替的选项。
执行第2组交替的第一个选项。它匹配"675-441-3144"
。
第2组的轮换在其选项之一匹配时成功短路。
现在,第2组整体等于匹配的选项,即"675-441-3144"
。
现在,光标位于"675-441-3144"
之后,也就是";;;78888464#"
之前。
第11组执行。它匹配下一个"<"
中所有的所有内容。
因此,您希望放在第2组中的某些内容实际上是在第11组中。
解决方案
请同时执行以下两项操作:
将第2组的内容转换为
option1|option2
option1(option2)?|option2
";;;78888464#<"
更改为
$11
。
$12
,第2组将不可能匹配
option1(option2)?|option2
。这是因为我们原始的“选项1”将匹配所有
"675-441-3144;;;78888464#"
,然后停止。然后,我们原来的“选项2”将尝试匹配
"675-441-3144"
,但是将无法匹配,因为它以6-10位数字的强制捕获组开头:
";;;78888464#"
,而
(\d{6,16})
以分号开头。
(\d{6,16})([;,\.]{1,3}\d{3,}#?)?
([;,\.]{1,3}\d{3,}#?)?
";;;78888464#"
量词的单个组组成,就有可能成功匹配零长度子串。因此,我们的模式模板
?
可能会导致长度为零的匹配,这不能满足匹配电话号码的预期目的。
option1(newoption2)?|newoption2
更改为
$12
,因为现在已经在两个位置删除了一个组。
(>[^<]*?)((\+?\d{1,4}[ \t\f\-\.](\d[ \t\f\-\.])?)?(\(\d{1,4}([\s-]\d{1,4})?\)[\.\- \t\f])?((\d{2,6}[\.\- \t\f])+\d{2,6})([;,\.]{1,3}\d{3,}#?)?|[;,\.]{1,3}\d{3,}#?)([^<]*<)
$1<a href="tel:$2">$2</a>$10
final String searchRegex = "(>[^<]*?)((\\+?\\d{1,4}[ \\t\\f\\-\\.](\\d[ \\t\\f\\-\\.])?)?(\\(\\d{1,4}([\\s-]\\d{1,4})?\\)[\\.\\- \\t\\f])?((\\d{2,6}[\\.\\- \\t\\f])+\\d{2,6})([;,\\.]{1,3}\\d{3,}#?)?|[;,\\.]{1,3}\\d{3,}#?)([^<]*<)";
final String replacementRegex = "$1<a href=\"tel:$2\">$2</a>$10";
String text = "<span style=\"font-size:11.0pt\">675-441-3144;;;78888464#<o:p></o:p></span>";
String replacement = text.replaceAll(searchRegex, replacementRegex);
关于java - Java正则表达式向后引用两位数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41562525/
我正在用 yacc/bison 编写一个简单的计算器。 表达式的语法看起来有点像这样: expr : NUM | expr '+' expr { $$ = $1 + $3; } | expr '-'
我开始学习 lambda 表达式,并在以下情况下遇到了以下语句: interface MyNumber { double getValue(); } MyNumber number; nu
这两个 Linq 查询有什么区别: var result = ResultLists().Where( c=> c.code == "abc").FirstOrDefault(); // vs. va
如果我们查看 draft C++ standard 5.1.2 Lambda 表达式 段 2 说(强调我的 future ): The evaluation of a lambda-expressio
我使用的是 Mule 4.2.2 运行时、studio 7.5.1 和 Oracle JDK 1.8.0_251。 我在 java 代码中使用 Lambda 表达式,该表达式由 java Invoke
我是 XPath 的新手。我有网页的html源 http://london.craigslist.co.uk/com/1233708939.html 现在我想从上面的页面中提取以下数据 完整日期 电子
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我将如何编写一个 Cron 表达式以在每天上午 8 点和下午 3:30 触发?我了解如何创建每天触发一次的表达式,而不是在多个设定时间触发。提前致谢 最佳答案 你应该只使用两行。 0 8 * * *
这个问题已经有答案了: What do 3 dots next to a parameter type mean in Java? (9 个回答) varargs and the '...' argu
我是 python 新手,在阅读 BeautifulSoup 教程时,我不明白这个表达式“[x for x in titles if x.findChildren()][:-1]”我不明白?你能解释一
(?:) 这是一个有效的 ruby 正则表达式,谁能告诉我它是什么意思? 谢谢 最佳答案 正如其他人所说,它被用作正则表达式的非捕获语法,但是,它也是正则表达式之外的有效 ruby 语法。 在
这个问题在这里已经有了答案: Why does ++[[]][+[]]+[+[]] return the string "10"? (10 个答案) 关闭 8 年前。 谁能帮我处理这个 JavaSc
这个问题在这里已经有了答案: What is the "-->" operator in C++? (29 个答案) Java: Prefix/postfix of increment/decrem
这个问题在这里已经有了答案: List comprehension vs. lambda + filter (16 个答案) 关闭 10 个月前。 我不确定我是否需要 lambda 或其他东西。但是,
C 中的 assert() 函数工作原理对我来说就像一片黑暗的森林。根据这里的答案https://stackoverflow.com/a/1571360 ,您可以使用以下构造将自定义消息输出到您的断言
在this页,John Barnes 写道: If the conditional expression is the argument of a type conversion then effec
我必须创建一个调度程序,它必须每周从第一天上午 9 点到第二天晚上 11 点 59 分运行 2 天(星期四和星期五)。为此,我需要提供一个 cron 表达式。 0-0 0-0 9-23 ? * THU
我正在尝试编写一个 Linq 表达式来检查派生类中的属性,但该列表由来自基类的成员组成。下面的示例代码。以“var list”开头的 Process 方法的第二行无法编译,但我不确定应该使用什么语法来
此 sed 表达式将输入字符串转换为两行输出字符串。两条输出行中的每一行都由输入的子串组成。第一行需要转换成大写: s:random_stuff\(choice1\|choice2\){\([^}]*
我正在使用 Quartz.Net 在我的应用程序中安排我的工作。我只是想知道是否可以为以下场景构建 CRON 表达式: Every second between 2:15AM and 5:20AM 最
我是一名优秀的程序员,十分优秀!