Regexpal网站(http://www.regexpal.com)
※字符串字面值(string literal)@H_301_0@
@H_301_0@
@H_301_0@
※[0-9]@H_301_0@
正则表达式[0-9]对正则表达式处理器传递的信息是“匹配0到9范围内的任意数字”。
@H_301_0@
@H_301_0@ 正则表达式将方括号视为特殊的元字符(Metacharacter),因此方括号不参与匹配。元字符是在正则表达式中有特殊含义的字符,@H_301_0@ 也是保留字符。[0-9]这种形式的正则表达式称做字符组(character class),有时也叫字符集(character set)。
※[0-9]→进一步限定
可以对数字的范围进行进一步了限定。用更具体的一组数字也能得到同样的结果,比如: @H_301_0@ [012789] @H_301_0@ 这个字符组只会匹配列出的数字,即0、1、2、7、8、9。@H_301_0@
要匹配任意10位以连字符分隔的北美电话号码,可以使用以下正则表达式。@H_301_0@
[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]@H_301_0@
※使用字符组简写式
\d 可以像[0-9]一样匹配任意阿拉伯数字。这种正则表达式叫做字符组简写式(character shorthand),也叫转义字符(character escape)。
\d\d\d-\d\d\d-\d\d\d\d @H_301_0@
也可以以连字符分隔的北美电话号码。
@H_301_0@
\D它匹配任何一个非数字字符@H_301_0@ \d\d\d\D\d\d\d\D\d\d\d\d
也可以以连字符分隔的北美电话号码。
※匹配任意字符
还可以用点号(.)来匹配那些讨厌的连字符:@H_301_0@ \d\d\d.\d\d\d.\d\d\d\d
也可以以连字符分隔的北美电话号码。
@H_301_0@
点号(英文句号)是一个通配符,可以匹配任意字符(但某些情况下不能匹配行起始符)。@H_301_0@
以上示例中的正则表达式匹配了连字符,但它也可以匹配百分号(%): @H_301_0@ 707%827%7019 @H_301_0@ 或者是竖线(|): @H_301_0@ 707|827|7019※捕获分和后向引用
使用捕获分组(capturing group)来匹配电话号码中的某一部分。然后使用后向引用(backreference)对分组中的内容进行引用。
要创建捕获分组,先将一个\d放在一对圆括号中,这样就将它放入了一个分组中,@H_301_0@ 后面可以用\l来对捕获的内容进行后向引用:@H_301_0@ (\d)\d\l@H_301_0@ \l对括号内分组捕获的内容进行了反向引用。这个正则表达式匹配的是区号707。@H_301_0@ 以下是对该表达式的详细分析:@H_301_0@ ●(\d)匹配第一个数字并将其捕获(数字7);@H_301_0@ ●\d匹配第二个数字(数字0)但没有捕获,因为没有括号;@H_301_0@ ●\l对捕获的数字进行反向引用(数字7)。
@H_301_0@
(\d)0\l\D\d\d\l\D\l\d\d\d