正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个字符串是否含有某种子串、将匹配的子串做替换或者从某个字符串中取出符合某个条件的子串等。
正则表达式的创建方式
pattern:正则表达式
flags:标识(修饰符)
标识主要包括:
i 忽略大小写匹配
m 多行匹配,即在到达一行文本末尾时还会继续寻常下一行中是否与正则匹配的项
g 全局匹配 模式应用于所有字符串,而非在找到第一个匹配项时停止
字面量创建方式和构造函数创建方式的区别
字面量创建方式不能进行字符串拼接,实例创建方式可以
字面量创建方式特殊含义的字符不需要转义,实例创建方式需要转义
元字符
代表次数的量词元字符
量词出现在元字符后面 如\d+,限定出现在前面的元字符的次数
一般[]中的字符没有特殊含义 如+就表示+,但是像\w这样的还是有特殊含义的;
[]中,不会出现两位数;
|
|
()的提高优先级功能:凡是有|出现的时候,我们一定要注意是否有必要加上()来提高优先级;
()的分组 重复子项 (两个放到一起说);
分组:
只要正则中出现了小括号那么就会形成一份分组
只要有分组,exec(match)和replace中的结果就会发生改变(后边的正则方法中再说)
分组的引用(重复子项) :
只要在正则中出现了括号就会形成一个分组,我们可以通过\n (n是数字代表的是第几个分组)来引用这个分组,第一个小分组我们可以用\1来表示
例如:求出这个字符串’abAAbcBCCccdaACBDDabcccddddaab’中出现最多的字母,并求出出现多少次(忽略大小写)。
当我们加()只是为了提高优先级而不想捕获小分组时,可以在()中加?:来取消分组的捕获;
|
|
正则运算符的优先级
正则表达式从左到右进行计算,并遵循优先级顺序,这与算术表达式非常类似。
相同优先级的会从左到右进行运算,不同优先级的运算先高后低。
下面是常见的运算符的优先级排列,依次从最高到最低说明各种正则表达式运算符的优先级顺序:
正则的特性
贪婪性:
所谓的贪婪性就是正则在捕获时,每一次会尽可能多的去捕获符合条件的内容。如果我们想尽可能的少的去捕获符合条件的字符串的话,可以在量词元字符后加”?”;
懒惰性:
懒惰性则是正则在成功捕获一次后不管后边的字符串有没有符合条件的都不再捕获。如果想捕获目标中所有符合条件的字符串的话,我们可以用标识符g来标明是全局捕获;
|
|
和正则相关的一些方法
这里我们只介绍test、exec、match和replace这四个方法;
reg.test(str) 用来验证字符串是否符合正则 符合返回true 否则返回false
reg.exec() 用来捕获符合规则的字符串
当我们用exec进行捕获时,如果正则没有加’g’标识符,则exec捕获的每次都是同一个,当正则中有’g’标识符时 捕获的结果就不一样了,我们还是来看刚刚的例子
每次调用exec方法时,捕获到的字符串都不相同
lastIndex :这个属性记录的就是下一次捕获从哪个索引开始。
当未开始捕获时,这个值为0。
如果当前次捕获结果为null。那么lastIndex的值会被修改为0.下次从头开始捕获。
而且这个lastIndex属性还支持人为赋值。
exec的捕获还受分组()的影响
|
|
str.match(reg) 如果匹配成功,就返回匹配成功的数组,如果匹配不成功,就返回null
|
|
上边两个方法console的结果有什么不同呢?二个字符串是一样滴。
当我们进行全局匹配时,二者的不同就会显现出来了.
|
|
当全局匹配时,match方法会一次性把符合匹配条件的字符串全部捕获到数组中,
如果想用exec来达到同样的效果需要执行多次exec方法。
我们可以尝试着用exec来简单模拟下match方法的实现。
此外,match和exec都可以受到分组()的影响,不过match只在没有标识符g的情况下才显示小分组的内容,如果有全局g,则match会一次性全部捕获放到数组中
|
|
str.replace() 这个方法大家肯定不陌生,现在我们要说的就是和这个方法和正则相关的东西了。
|
|
从结果看来我们的猜测没问题。
此外,我们需要注意的是,如果我们需要替换replace中正则找到的字符串,函数中需要一个返回值去替换正则捕获的内容。
通过replace方法获取url中的参数的方法
|
|
零宽断言
用于查找在某些内容(但并不包括这些内容)之前或之后的东西,如\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言。
在使用正则表达式时,捕获的内容前后必须是特定的内容,而我们又不想捕获这些特定内容的时候,零宽断言就可以派上用场了。
零宽度正预测先行断言 (?=exp)
零宽度负预测先行断言 (?!exp)
零宽度正回顾后发断言 (?<=exp)
零宽度负回顾后发断言 (?<!exp)
这四胞胎看着名字好长,给人一种好复杂好难的感觉,我们还是挨个来看看它们究竟是干什么的吧。
(?=exp) 这个简单理解就是说字符出现的位置的右边必须匹配到exp这个表达式。
|
|
这个看起来似乎是正确的,实际上结果是false
reg中a(?=b)匹配字符串’abc’ 字符串a的右边是b这个匹配没问题,接下来reg中a(?=b)后边的c匹配字符串时是从字符串’abc’中a的后边b的前边的这个位置开始匹配的,
这个相当于/ac/匹配’abc’,显然结果是false了;
(?!exp) 这个就是说字符出现的位置的右边不能是exp这个表达式。
|
|
(?<=exp) 这个就是说字符出现的位置的前边是exp这个表达式。
|
|
(?<!exp) 这个就是说字符出现的位置的前边不能是exp这个表达式。
|
|
###(感谢)转载自:http://www.cnblogs.com/chenmeng0818/p/6370819.html
访客的ip和所在地址: 访问时间: 当前时间: