概念
在前面的文章中,我们知道元字符\b、^匹配的是一个位置,而且这个位置需要满足一些情
况 。这样把满足这一条件称为断言或零宽度断言。下面看看正则表达式中常用的零宽度断言。
上述表达式同样也是匹配一个位置
零宽度断言
零宽度断言用于查找在某些内容之前或则之后的东西,用于指定一个位置,它声明一个为真的
事实:正则表达式中只有断言为真的时候才继续匹配
零宽度正预测先行断言
(?=exp)匹配exp前面的位置。
例子:[a-z]*(?=ing)可以匹配cooking和singing中的“cook”与“sing”
tips:先行断言的执行步骤应该是从要匹配字符的最右端找到第一个“ing”,在匹配前面的
表达式,如无法匹配则查找第二个“ing”,,类推....符合正则的贪婪性。
零宽度正回顾后发断言
(?<=exp)匹配exp后面的位置。
例子:(?<=abc).*可以匹配abcdefgabc中的defgabc而不是abcdefg
tips:通过比较很容易看出后发断言和先行断言正好相反:它先从要匹配的字符串的最左端
进行查找断言表达式,之后匹配后面的字符串,如果无法匹配则继续查找第二个断言表达式
如此反复...
零宽度负预测先行断言
(?!exp)匹配后面跟的不是exp的位置
例子:(java)(?!(hello)):匹配java字符串,但是后面不能跟hello
零宽度负回顾后发断言
(?<!exp)匹配前面不是exp的位置
例子:(?<!(java))(hello)匹配hello字符串但是前面不能有java
练习
例子1:
匹配不包含连续字符串"java"的单词:\b((?!(java))\w)+\b
例子2:
匹配简单html标签中的内容:(?<=<(\w)>).*(?=<\/\1>)
好了关于断言就是这些了!