- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Javascript中正则表达式的使用及基本语法由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
前面的话 。
正则表达式在人们的印象中可能是一堆无法理解的字符,但就是这些符号却实现了字符串的高效操作。通常的情况是,问题本身并不复杂,但没有正则表达式就成了大问题。javascript中的正则表达式作为相当重要的知识,本文将介绍正则表达式的基础语法 。
定义 。
正则表达式(Regular Expression)是一门简单语言的语法规范,是强大、便捷、高效的文本处理工具,它应用在一些方法中,对字符串中的信息实现查找、替换和提取操作 。
javascript中的正则表达式用RegExp对象表示,有两种写法:一种是字面量写法;另一种是构造函数写法 。
正则表达式用来处理字符串特别好用,在JavaScript中能用到正则表达式的地方有很多,本文对正则表达式基础知识和Javascript中正则表达式的使用做一个总结.
第一部分简单列举了正则表达式在JavaScript中的使用场景;第二部分详细介绍正则表达式的基础知识,写出一些例子方便理解.
本文的内容是我自己看完正则表达式写法,和犀牛书中js正则表达式的章节后的总结,所以内容可能会有疏漏和不严谨的地方。若有大神路过发现文中错误的地方,欢迎斧正! 。
Javascript中正则表达式的使用 。
一个正则表达式可以认为是对一种字符片段的特征描述,而它的作用就是从一堆字符串中找出满足条件的子字符串。比如我在JavaScript中定义一个正则表达式:
1
|
var
reg=/hello/ 或者
var
reg=
new
RegExp(
"hello"
)
|
那么这个正则表达式可以用来从一堆字符串中找出 hello 这个单词。而“找出”这个动作,其结果可能是找出第一个hello的位置、用别的字符串替换hello、找出所有hello等等。下面就列举一下JavaScript中可以使用正则表达式的函数,简单介绍一下这些函数的作用,更复杂的用法会在第二部分中介绍.
String.prototype.search方法 。
用来找出原字符串中某个子字符串首次出现的index,没有则返回-1 。
1
|
"abchello"
.search(/hello/);
// 3
|
String.prototype.replace方法 。
用来替换字符串中的子串 。
1
|
"abchello"
.replace(/hello/,
"hi"
);
// "abchi"
|
String.prototype.split方法 。
用来分割字符串 。
1
|
"abchelloasdasdhelloasd"
.split(/hello/);
//["abc", "asdasd", "asd"]
|
String.prototype.match方法 。
用来捕获字符串中的子字符串到一个数组中。默认情况下只捕获一个结果到数组中,正则表达式有”全局捕获“的属性时(定义正则表达式的时候添加参数g),会捕获所有结果到数组中 。
1
2
|
"abchelloasdasdhelloasd"
.match(/hello/);
//["hello"]
"abchelloasdasdhelloasd"
.match(/hello/g);
//["hello","hello"]
|
作为match参数的正则表达式在是否拥有全局属性的情况下,match方法的表现还不一样,这一点会在后边的正则表达式分组中讲到.
RegExp.prototype.test方法 。
用来测试字符串中是否含有子字符串 。
1
|
/hello/.test(
"abchello"
);
// true
|
RegExp.prototype.exec方法 。
和字符串的match方法类似,这个方法也是从字符串中捕获满足条件的字符串到数组中,但是也有两个区别.
1. exec方法一次只能捕获一份子字符串到数组中,无论正则表达式是否有全局属性 。
1
2
|
var
reg=/hello/g;
reg.exec(
"abchelloasdasdhelloasd"
);
// ["hello"]
|
2. 正则表达式对象(也就是JavaScript中的RegExp对象)有一个lastIndex属性,用来表示下一次从哪个位置开始捕获,每一次执行exec方法后,lastIndex就会往后推,直到找不到匹配的字符返回null,然后又从头开始捕获。 这个属性可以用来遍历捕获字符串中的子串.
1
2
3
4
5
6
7
8
|
var
reg=/hello/g;
reg.lastIndex;
//0
reg.exec(
"abchelloasdasdhelloasd"
);
// ["hello"]
reg.lastIndex;
//8
reg.exec(
"abchelloasdasdhelloasd"
);
// ["hello"]
reg.lastIndex;
//19
reg.exec(
"abchelloasdasdhelloasd"
);
// null
reg.lastIndex;
//0
|
正则表达式基础 。
元字符 。
上面第一节以/hello/为例,但是实际应用中可能会遇到这样的需求: 匹配一串不确定的数字、匹配开始的位置、匹配结束的位置、匹配空白符。此时就可以用到元字符.
元字符:
1
2
3
4
5
6
7
8
9
10
11
12
|
//匹配数字: \d
"ad3ad2ad"
.match(/\d/g);
// ["3", "2"]
//匹配除换行符以外的任意字符: .
"a\nb\rc"
.match(/./g);
// ["a", "b", "c"]
//匹配字母或数字或下划线 : \w
"a5_ 汉字@!-="
.match(/\w/g);
// ["a", "5", "_"]
//匹配空白符:\s
"\n \r"
.match(/\s/g);
//[" ", " ", ""] 第一个结果是\n,最后一个结果是\r
//匹配【单词开始或结束】的位置 : \b
"how are you"
.match(/\b\w/g);
//["h", "a", "y"]
// 匹配【字符串开始和结束】的位置: 开始 ^ 结束 $
"how are you"
.match(/^\w/g);
// ["h"]
|
反义元字符,写法就是把上面的小写字母变成大写的,比如 , 匹配所有不是数字的字符: \D 。
另外还有一些用来表示重复的元字符,会在下面的内容中介绍.
字符范围 。
在 [] 中使用符号 - ,可以用来表示字符范围。如:
1
2
3
4
5
6
7
8
|
// 匹配字母 a-z 之间所有字母
/[a-z]/
// 匹配Unicode中 数字 0 到 字母 z 之间的所有字符
/[0-z]/
// unicode编码查询地址:
//https://en.wikibooks.org/wiki/Unicode/Character_reference/0000-0FFF
//根据上面的内容,我们可以找出汉字的Unicode编码范围是 \u4E00 到 \u9FA5,所以我们可以写一个正则表达式来判断一个字符串中是否有汉字
/[\u4E00-\u9FA5]/.test(
"测试"
);
// true
|
重复 & 贪婪与懒惰 。
首先来讲重复,当我们希望匹配一些重复的字符时,就需要用到一些和重复相关的正则表达式,写法如下 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
//重复n次 {n}
"test12"
.match(/test\d{3}/);
// null
"test123"
.match(/test\d{3}/);
// ["test123"]
//重复n次或更多次 {n,}
"test123"
.match(/test\d{3,}/);
// ["test123"]
//重复n到m次
"test12"
.match(/test\d{3,5}/);
// null
"test12345"
.match(/test\d{3,5}/);
// ["test12345"]
"test12345678"
.match(/test\d{3,5}/);
// ["test12345"]
// 匹配字符test后边跟着数字,数字重复0次或多次
"test"
.match(/test\d*/);
// ["test"]
"test123"
.match(/test\d*/);
// ["test123"]
//重复一次或多次
"test"
.match(/test\d+/) ;
// null
"test1"
.match(/test\d*/);
//["test1"]
//重复一次或0次
"test"
.match(/test\d?/) ;
// null
"test1"
.match(/test\d?/);
//["test1"]
|
从上面的结果可以看到,字符test后边跟着的数字可以重复0次或多次时,正则表达式捕获的子字符串会返回尽量多的数字,比如/test\d*/匹配 test123 ,返回的是test123,而不是test或者test12.
正则表达式捕获字符串时,在满足条件的情况下捕获尽可能多的字符串,这就是所谓的“贪婪模式”.
对应的”懒惰模式“,就是在满足条件的情况下捕获尽可能少的字符串,使用懒惰模式的方法,就是在字符重复标识后面加上一个 "?",写法如下 。
1
2
3
4
|
// 数字重复3~5次,满足条件的情况下返回尽可能少的数字
"test12345"
.match(/test\d{3,5}?/);
//["test123"]
// 数字重复1次或更多,满足条件的情况下只返回一个数字
"test12345"
.match(/test\d+?/);
// ["test1"]
|
字符转义 。
在正则表达式中元字符是有特殊的含义的,当我们要匹配元字符本身时,就需要用到字符转义,比如:
/\./.test("."); // true 。
分组 & 分支条件 。
正则表达式可以用 " () " 来进行分组,具有分组的正则表达式除了正则表达式整体会匹配子字符串外,分组中的正则表达式片段也会匹配字符串.
分组按照嵌套关系和前后关系,每个分组会分配得到一个数字组号,在一些场景中可以用组号来使用分组.
在 replace、match、exec函数中,分组都能体现不同的功能.
replace函数中,第二个参数里边可以用 $+数字组号来指代第几个分组的内容,如:
" the best language in the world is java ".replace(/(java)/,"$1script"); // " the best language in the world is javascript " "/static/app1/js/index.js".replace(/(\/\w+)\.js/,"$1-v0.0.1.js"); //"/static/app1/js/index-v0.0.1.js" (\/\w+)分组匹配的就是 /index , 。
在第二个参数中为其添加上版本号 。
match函数中,当正则表达式有全局属性时,会捕获所有满足正则表达式的子字符串 。
1
|
"abchellodefhellog"
.match(/h(ell)o/g);
//["hello", "hello"]
|
但是当正则表达式没有全局属性,且正则表达式中有分组的时候,match函数只会返回整个正则表达式匹配的第一个结果,同时会将分组匹配到的字符串也放入结果数组中:
1
2
3
4
|
"abchellodefhellog"
.match(/h(ell)o/);
//["hello", "ell"]
// 我们可以用match函数来分解url,获取协议、host、path、查询字符串等信息
"http://www.baidu.com/test?t=5"
.match(/^((\w+):\/\/([\w\.]+))\/([^?]+)\?(\S+)$/);
// ["http://www.baidu.com/test?t=5", "http://www.baidu.com", "http", "www.baidu.com", "test", "t=5"]
|
exec函数在正则表达式中有分组的情况下,表现和match函数很像,只是无论正则表达式是否有全局属性,exec函数都只返回一个结果,并捕获分组的结果 。
1
|
/h(ell)o/g.exec(
"abchellodefhellog"
);
//["hello", "ell"]
|
当正则表达式需要匹配几种类型的结果时,可以用到分支条件,例如 。
1
2
|
"asdasd hi asdad hello asdasd"
.replace(/hi|hello/,
"nihao"
);
//"asdasd nihao asdad hello asdasd"
"asdasd hi asdad hello asdasd"
.split(/hi|hello/);
//["asdasd ", " asdad ", " asdasd"]
|
注意,分支条件影响它两边的所有内容, 比如 hi|hello 匹配的是hi或者hello,而不是 hiello 或者 hhello 。
分组中的分支条件不会影响分组外的内容 。
1
|
"abc acd bbc bcd "
.match(/(a|b)bc/g);
//["abc", "bbc"]
|
后向引用 。
正则表达式的分组可以在其后边的语句中通过 \+数字组号来引用 。
比如 。
1
2
|
// 匹配重复的单词
/(\b[a-zA-Z]+\b)\s+\1/.exec(
" asd sf hello hello asd"
);
//["hello hello", "hello"]
|
断言 。
(?:exp) , 用此方式定义的分组,正则表达式会匹配分组中的内容,但是不再给此分组分配组号,此分组在replace、match等函数中的作用也会消失,效果如下:
1
2
3
4
|
/(hello)\sworld/.exec(
"asdadasd hello world asdasd"
)
// ["hello world", "hello"],正常捕获结果字符串和分组字符串
/(?:hello)\sworld/.exec(
"asdadasd hello world asdasd"
)
// ["hello world"]
"/static/app1/js/index.js"
.replace(/(\/\w+)\.js/,
"$1-v0.0.1.js"
);
//"/static/app1/js/index-v0.0.1.js"
"/static/app1/js/index.js"
.replace(/(?:\/\w+)\.js/,
"$1-v0.0.1.js"
);
//"/static/app1/js$1-v0.0.1.js"
|
(?=exp) 这个分组用在正则表达式的后面,用来捕获exp前面的字符,分组中的内容不会被捕获,也不分配组号 。
1
|
/hello\s(?=world)/.exec(
"asdadasd hello world asdasd"
)
// ["hello "]
|
(?!exp) 和前面的断言相反,用在正则表达式的后面,捕获后面不是exp的字符,同样不捕获分组的内容,也不分配组号 。
1
|
/hello\s(?!world)/.exec(
"asdadasd hello world asdasd"
)
//null
|
处理选项 。
javascript中正则表达式支持的正则表达式有三个,g、i、m,分别代表全局匹配、忽略大小写、多行模式。三种属性可以自由组合共存.
1
2
3
4
5
6
|
// 全局匹配 g
"abchelloasdasdhelloasd"
.match(/hello/);
//["hello"]
"abchelloasdasdhelloasd"
.match(/hello/g);
//["hello","hello"]
//忽略大小写 i
"abchelloasdasdHelloasd"
.match(/hello/g);
//["hello"]
"abchelloasdasdHelloasd"
.match(/hello/gi);
//["hello","Hello"]
|
在默认的模式下,元字符 ^ 和 $ 分别匹配字符串的开头和结尾处,模式 m 改变了这俩元字符的定义,让他们匹配一行的开头和结尾 。
1
2
|
"aadasd\nbasdc"
.match(/^[a-z]+$/g);
//null 字符串^和$之间有换行符,匹配不上 [a-z]+ ,故返回null
"aadasd\nbasdc"
.match(/^[a-z]+$/gm);
// ["aadasd", "basdc"] ,改变^$的含义,让其匹配一行的开头和末尾,可以得到两行的结果
|
总结 。
以上所述是小编给大家介绍的Javascript中正则表达式的使用及基本语法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我网站的支持! 。
原文链接:http://blog.csdn.net/longdreams/article/details/78353352 。
最后此篇关于Javascript中正则表达式的使用及基本语法的文章就讲到这里了,如果你想了解更多关于Javascript中正则表达式的使用及基本语法的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我有一个加号/减号按钮,希望用户不能选择超过 20 个但不知道如何让它工作。我尝试使用 min="1"max="5 属性,但它们不起作用。这是我的代码和一个 fiddle 链接。https://jsf
我正在尝试复制顶部底部图,如示例 here但它没有正确渲染(紫色系列有 +ve 和 -ve 值,绿色为负值)留下杂乱的人工制品。我也在努力创建一个玩具示例来复制这个问题,所以我希望尽管我缺乏数据,但有
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 6 年前。 社区去年审查了是
这个问题在这里已经有了答案: Adding two positive integers gives negative answer.Why? (4 个答案) 关闭 5 年前。 我遇到了一个奇怪的问题
有谁知道如何将字符串值类型 -4,5 或 5,4 转换为 double -4.5 或 5.4? 最佳答案 只需使用 Double.parseDouble(Locale, String); 糟糕,我很困
我正在尝试根据 TextBlob 分类插入一个仅包含“正”或“负”字符串的新数据框列:对于我的 df 的第一行,结果是 ( pos , 0.75, 0.2499999999999997)我想要' 正
我对 VBA 非常陌生,无法理解如何在一个循环中完成 2 个任务。我非常感谢您的帮助。 我已经能够根据第 3 列中的数据更改第 2 列中的数值,但我不明白如何将负值的字体更改为红色。 表格的大小每月都
欢迎, 我正在使用 jquery 通过 POST 发送表单。 这就是我获得值(value)的方式。 var mytext = $("#textareaid").val(); var dataStrin
double d = 0; // random decimal value with it's integral part within the range of Int32 and always p
我有这个字符串: var a='abc123#xyz123'; 我想构建 2 个正则表达式替换函数: 1) 用 '*' 替换所有确实有 future '#'的字符(不包括'#') 所以结果应该是这样的
我正在使用 DialogFragment。当用户从 Gmail 平板电脑应用程序的屏幕与下面示例图片中的编辑文本进行交互时,我希望正面和负面按钮保持在键盘上方。 在我的尝试中不起作用,这是我的 Dia
从组装艺术一书中,我复制了这句话: In the two’s complement system, the H.O. bit of a number is a sign bit. If the H.O
是否有更好更优雅的方法来实现下面的简单代码(diffYear、A 和 B 是数字): diffYear = yearA - yearB; if (diffYear == 0) { A = B
我正在设计一种语言,并尝试确定 true 应该是 0x01 还是 0xFF。显然,所有非零值都将转换为 true,但我正在尝试确定确切的内部表示。 每种选择的优点和缺点是什么? 最佳答案 没关系,只要
在我的 dialogfragment 类的 OnCreateDialog 中,我正在这样做: AlertDialog.Builder builder = new AlertDialog.Builder
这个问题在这里已经有了答案: Resolving ambiguous overload on function pointer and std::function for a lambda usin
我偶然发现了一个奇怪的 NSDecimalNumber 行为:对于某些值,调用 integerValue、longValue、longLongValue 等,返回意想不到的值(value)。示例: l
这个问题在这里已经有了答案: Resolving ambiguous overload on function pointer and std::function for a lambda using
我有这个正则表达式来测试用户输入是否有效: value.length === 0 || value === '-' || (!isNaN(parseFloat(value)) && /^-?\d+\.
我想用高斯混合模型拟合数据集,数据集包含大约 120k 个样本,每个样本有大约 130 个维度。当我使用 matlab 执行此操作时,我运行脚本(簇号为 1000): gm = fitgmdist(d
我是一名优秀的程序员,十分优秀!