- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章正则表达式教程之位置匹配详解由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
本文实例讲述了正则表达式教程之位置匹配。分享给大家供大家参考,具体如下:
注:在所有例子中正则表达式匹配结果包含在源文本中的【和】之间,有的例子会使用Java来实现,如果是java本身正则表达式的用法,会在相应的地方说明。所有java例子都在JDK1.6.0_13下测试通过.
1、问题引入 。
如果想匹配一段文本中的某个单词(暂不考虑多行模式,将在后面介绍),我们可能会像下面这样:
文本:Yesterday is history, tomorrow is a mystery, but today is a gift. 。
正则表达式:is 。
结果:Yesterday 【is】 h【is】tory, tomorrow 【is】 a mystery, but today 【is】 a gift. 。
分析:本来只是要匹配单词is,但把其他单词中包含的is也匹配出来了。要解决这个问题,使用边界界定符,也就是在正则表达式里用一些元字符来表明我们想让匹配操作在什么位置(或边界)发生.
2、单词边界 。
一种常用的边界是由限定符\b指定的单词边界,\b用来匹配单词的开始和结尾。更确切地说,它是匹配这样一个位置,这个位置位于一个能够用来构成单词的字符(字母、数字、下划线,也就是与\w相匹配的字符)和一个不能用来构成单词的字符(与\W相匹配的字符)之间。来看前面的例子:
文本:Yesterday is history, tomorrow is a mystery, but today is a gift. 。
正则表达式:\bis\b 。
结果:Yesterday 【is】 history, tomorrow 【is】 a mystery, but today 【is】 a gift. 。
分析:在原始文本中,单词is的前后都有一个空格,而这与模式\bis\b匹配(空格是用来分隔单词的字符之一)。而单词history中也包含了is,因为它的前后分别有一个字符h和t,这两个字符都不能与\b匹配.
如果不匹配一个单词边界,则使用\B。如:
文本:Please enter the nine-digit id as it appears on your color - coded pass-key. 。
正则表达式:\B-\B 。
结果:Please enter the 【nine-digit】 id as it appears on your color - coded 【pass-key】. 。
分析:\B-\B将匹配一个前后都不是单词边界的连字符,nine-digit和pass-key中连字符前后都没有空格,所以能够匹配,而color - coded中连字符前后都有空格,所以不能匹配.
3、字符串边界 。
单词边界可以用来进行与单词有关的位置匹配(单词开头、结束、整个单词等等)。而字符串边界也有着类似的用途,只不过是用来进行与字符串有关的位置匹配(字符串开头、结束、整个字符串等等)。用来定义字符串边界的元字符有两个:一个是用来定义字符串开头的^,另一个是用来定义字符串结尾的$.
比如要检查一个XML文档的合法性,合法的XML文档都以<?xml…..?>这样形式开头:
文本:
1
2
3
|
<?
xml
version
=
"1.0"
encoding
=
"UTF-8"
?>
<
project
basedir
=
"."
default
=
"ear"
>
</
project
>
|
正则表达式:^\s*<\?xml.*?\?> 。
结果:
<?xml version="1.0" encoding="UTF-8"?> <project basedir="." default="ear"> </project> 。
分析:^匹配一个字符串的开头位置,所以^\s*将匹配一个字符串的开头位置和随后的零个或多个空白字符,因为<?xml>标签前面允许有空格、制表符、换行符等空白字符.
$元字符符的用法除了位置上的差异外,与^用法完全一样。比如,检查一个html页面是否以</html>结尾,可以用模式:</[Hh][Tt][Mm][Ll]>\s*$ 。
4、多行匹配模式 。
正则表达式可以通过一些特殊的元字符来改变另外一些元字符的行为。可以通过(?m) 来启用多行匹配模式。多行匹配模式将使得正则表达式引擎把行分隔符当做一个字符串分隔符来对待。在多行匹配模式下,^不仅匹配正常的字符串开头,还将匹配行分隔符(换行符)后面的开始位置,$不仅匹配正常的字符串结尾,还将匹配行分隔符(换行符)后面的结束位置.
在使用时,(?m)必须出现在整个模式的最前面。比如,通过正则表达式把一段java代码中的单行注释(以//开始)内容全部找出来.
文本:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
publicDownloadingDialog(Frame parent){
//Callsuper constructor, specifying that dialog box is modal.
super
(parent,
true
);
//Setdialog box title.
setTitle(
"E-mailClient"
);
//Instructwindow not to close when the "X" is clicked.
setDefaultCloseOperation(DO_NOTHING_ON_CLOSE);
//Puta message with a nice border in this dialog box.
JPanelcontentPanel =
new
JPanel();
contentPanel.setBorder(BorderFactory.createEmptyBorder(
5
,
5
,
5
,
5
));
contentPanel.add(newJLabel(
"Downloading messages..."
));
setContentPane(contentPanel);
//Sizedialog box to components.
pack();
//Centerdialog box over application.
setLocationRelativeTo(parent);
}
|
正则表达式:(?m)^\s*//.*$ 。
结果:
publicDownloadingDialog(Frame parent){ 【 //Call superconstructor, specifying that dialog box is modal.】 super(parent,true); 【 //Set dialog boxtitle.】 setTitle("E-mailClient"); 【 //Instruct windownot to close when the "X" is clicked.】 setDefaultCloseOperation(DO_NOTHING_ON_CLOSE); 【 //Put a messagewith a nice border in this dialog box.】 JPanelcontentPanel = new JPanel(); contentPanel.setBorder(BorderFactory.createEmptyBorder(5,5, 5, 5)); contentPanel.add(newJLabel("Downloading messages...")); setContentPane(contentPanel); 【 //Size dialog boxto components.】 pack(); 【 //Center dialogbox over application.】 setLocationRelativeTo(parent); } 。
分析:^\s*//.*$将匹配一个字符串的开始,然后是任意多个空白字符,再后面是//,再往后是任意文本,最后是一个字符串的结束。不过这个模式只能找出第一条注释,加上(?m)前缀后,将把换行符视为一个字符串分隔符,这样就可以把每一行注释匹配出来了.
java代码实现如下(文本保存在text.txt文件中):
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
|
public
static
String getTextFromFile(String path)
throws
Exception{
BufferedReader br =
new
BufferedReader(
new
FileReader(
new
File(path)));
StringBuilder sb =
new
StringBuilder();
char
[] cbuf =
new
char
[
1024
];
int
len =
0
;
while
(br.ready() && (len = br.read(cbuf)) >
0
){
br.read(cbuf);
sb.append(cbuf,
0
, len);
}
br.close();
return
sb.toString();
}
public
static
void
multilineMatch()
throws
Exception{
String text = getTextFromFile(
"E:/text.txt"
);
String regex =
"(?m)^\\s*//.*$"
;
Matcher m = Pattern.compile(regex).matcher(text);
while
(m.find()){
System.out.println(m.group());
}
}
|
输出结果如下:
//Call super constructor, specifying that dialog box is modal. //Set dialog box title. //Instruct window not to close when the "X" is clicked. //Put a message with a nice border in this dialog box. //Size dialog box to components. //Center dialog box over application. 。
5、小结 。
正则表达式不仅可以用来匹配任意长度的文本块,还可以用来匹配出现在字符串中特定位置的文本。\b用来指定一个单词边界(\B刚好相反)。^和$用来指定单词边界。如果与(?m)配合使用,^和$还将匹配在一个换行符处开头或结尾的字符串。在接下来的文章中将介绍子表达式的使用.
希望本文所述对大家正则表达式学习有所帮助.
最后此篇关于正则表达式教程之位置匹配详解的文章就讲到这里了,如果你想了解更多关于正则表达式教程之位置匹配详解的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我正在用 yacc/bison 编写一个简单的计算器。 表达式的语法看起来有点像这样: expr : NUM | expr '+' expr { $$ = $1 + $3; } | expr '-'
我开始学习 lambda 表达式,并在以下情况下遇到了以下语句: interface MyNumber { double getValue(); } MyNumber number; nu
这两个 Linq 查询有什么区别: var result = ResultLists().Where( c=> c.code == "abc").FirstOrDefault(); // vs. va
如果我们查看 draft C++ standard 5.1.2 Lambda 表达式 段 2 说(强调我的 future ): The evaluation of a lambda-expressio
我使用的是 Mule 4.2.2 运行时、studio 7.5.1 和 Oracle JDK 1.8.0_251。 我在 java 代码中使用 Lambda 表达式,该表达式由 java Invoke
我是 XPath 的新手。我有网页的html源 http://london.craigslist.co.uk/com/1233708939.html 现在我想从上面的页面中提取以下数据 完整日期 电子
已关闭。这个问题是 off-topic 。目前不接受答案。 想要改进这个问题吗? Update the question所以它是on-topic用于堆栈溢出。 已关闭10 年前。 Improve th
我将如何编写一个 Cron 表达式以在每天上午 8 点和下午 3:30 触发?我了解如何创建每天触发一次的表达式,而不是在多个设定时间触发。提前致谢 最佳答案 你应该只使用两行。 0 8 * * *
这个问题已经有答案了: What do 3 dots next to a parameter type mean in Java? (9 个回答) varargs and the '...' argu
我是 python 新手,在阅读 BeautifulSoup 教程时,我不明白这个表达式“[x for x in titles if x.findChildren()][:-1]”我不明白?你能解释一
(?:) 这是一个有效的 ruby 正则表达式,谁能告诉我它是什么意思? 谢谢 最佳答案 正如其他人所说,它被用作正则表达式的非捕获语法,但是,它也是正则表达式之外的有效 ruby 语法。 在
这个问题在这里已经有了答案: Why does ++[[]][+[]]+[+[]] return the string "10"? (10 个答案) 关闭 8 年前。 谁能帮我处理这个 JavaSc
这个问题在这里已经有了答案: What is the "-->" operator in C++? (29 个答案) Java: Prefix/postfix of increment/decrem
这个问题在这里已经有了答案: List comprehension vs. lambda + filter (16 个答案) 关闭 10 个月前。 我不确定我是否需要 lambda 或其他东西。但是,
C 中的 assert() 函数工作原理对我来说就像一片黑暗的森林。根据这里的答案https://stackoverflow.com/a/1571360 ,您可以使用以下构造将自定义消息输出到您的断言
在this页,John Barnes 写道: If the conditional expression is the argument of a type conversion then effec
我必须创建一个调度程序,它必须每周从第一天上午 9 点到第二天晚上 11 点 59 分运行 2 天(星期四和星期五)。为此,我需要提供一个 cron 表达式。 0-0 0-0 9-23 ? * THU
我正在尝试编写一个 Linq 表达式来检查派生类中的属性,但该列表由来自基类的成员组成。下面的示例代码。以“var list”开头的 Process 方法的第二行无法编译,但我不确定应该使用什么语法来
此 sed 表达式将输入字符串转换为两行输出字符串。两条输出行中的每一行都由输入的子串组成。第一行需要转换成大写: s:random_stuff\(choice1\|choice2\){\([^}]*
我正在使用 Quartz.Net 在我的应用程序中安排我的工作。我只是想知道是否可以为以下场景构建 CRON 表达式: Every second between 2:15AM and 5:20AM 最
我是一名优秀的程序员,十分优秀!