gpt4 book ai didi

正则表达式学习教程之回溯引用backreference详解

转载 作者:qq735679552 更新时间:2022-09-29 22:32:09 26 4
gpt4 key购买 nike

CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章正则表达式学习教程之回溯引用backreference详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.

本文实例讲述了正则表达式回溯引用backreference。分享给大家供大家参考,具体如下:

在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过.

1、问题引入 。

一个在HTML页面中匹配标题标签(H1—H6)的问题:

文本:

?
1
2
3
4
5
6
7
8
9
< body >
< h1 >Welcome to my page</ H1 >
Content is divided into twosections:< br >
< h2 >Introduction</ h2 >
Information about me.
< H2 >Hobby</ H2 >
Information about my hobby.
< h2 >This is invalid HTML</ h3 >
</ body >

正则表达式:<[hH][1-6]>.*?</[hH][1-6]> 。

结果:

<body> 【<h1>Welcome to my page</H1>】 Content is divided into twosections:<br> 【<h2>Introduction</h2>】 Information about me. 【<H2>Hobby</H2>】 Information about my hobby. 【<h2>This is invalid HTML</h3>】 </body> 。

分析:模式<[hH][1-6]>匹配任何一级标题的开始标签,而且不区分大小写,在这个例子中它匹配到了<h1>、<h2>,</[hH][1-6]>匹配到了</h1>、</h2>、</h3>;这里使用了懒惰型元字符来匹配标签中的文本,否则会匹配到从第一个开始标签到最后一下结束标签之间的内容。但是从结果可以看出,有一个无效的标签也匹配上了,即<h2></h3>,它们根本不能配对。要解决这个问题,就需要使用到回溯引用(backreference).

2、回溯引用匹配 。

回溯引用是指模式的后半部分引用在前半部分中定义的子表达式。至于子表达式的使用、划分和引用,在前面已经介绍过了。现在来解决前面的例子:

文本:

?
1
2
3
4
5
6
7
8
9
< body >
< h1 >Welcome to my page</ H1 >
Content is divided into twosections:< br >
< h2 >Introduction</ h2 >
Information about me.
< H2 >Hobby</ H2 >
Information about my hobby.
< h2 >This is invalid HTML</ h3 >
</ body >

正则表达式:<[hH]([1-6])>.*?</[hH]\1> 。

结果:

<body> 【<h1>Welcome to my page</H1>】 Content is divided into twosections:<br> 【<h2>Introduction</h2>】 Information about me. 【<H2>Hobby</H2>】 Information about my hobby. <h2>This is invalid HTML</h3> 。

分析:首先匹配开始标题标签的模式<[hH]([1-6])>,使用括号把[1-6]做为子表达式,而匹配结束标题标签模式为</[hH]\1>,其中\1表示引用第一个子表达式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一个无效的标题标签就不会被匹配到了.

希望本文所述对大家JavaScript程序设计有所帮助.

最后此篇关于正则表达式学习教程之回溯引用backreference详解的文章就讲到这里了,如果你想了解更多关于正则表达式学习教程之回溯引用backreference详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com