Regexpal网站(http://www.regexpal.com)
※字符串字面值(string literal)
※[0-9]
正则表达式[0-9]对正则表达式处理器传递的信息是“匹配0到9范围内的任意数字”。
正则表达式将方括号视为特殊的元字符(Metacharacter),因此方括号不参与匹配。元字符是在正则表达式中有特殊含义的字符,
也是保留字符。[0-9]这种形式的正则表达式称做字符组(character class),有时也叫字符集(character set)。
※[0-9]→进一步限定
可以对数字的范围进行进一步了限定。用更具体的一组数字也能得到同样的结果,比如:[012789]
这个字符组只会匹配列出的数字,即0、1、2、7、8、9。
要匹配任意10位以连字符分隔的北美电话号码,可以使用以下正则表达式。
[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9][0-9][0-9]
※使用字符组简写式
\d 可以像[0-9]一样匹配任意阿拉伯数字。这种正则表达式叫做字符组简写式(character shorthand),也叫转义字符(character escape)。
\d\d\d-\d\d\d-\d\d\d\d
也可以以连字符分隔的北美电话号码。
\D它匹配任何一个非数字字符
\d\d\d\D\d\d\d\D\d\d\d\d
也可以以连字符分隔的北美电话号码。
※匹配任意字符
还可以用点号(.)来匹配那些讨厌的连字符:
\d\d\d.\d\d\d.\d\d\d\d
也可以以连字符分隔的北美电话号码。
点号(英文句号)是一个通配符,可以匹配任意字符(但某些情况下不能匹配行起始符)。
707%827%7019
或者是竖线(|):
707|827|7019
※捕获分和后向引用
使用捕获分组(capturing group)来匹配电话号码中的某一部分。然后使用后向引用(backreference)对分组中的内容进行引用。
要创建捕获分组,先将一个\d放在一对圆括号中,这样就将它放入了一个分组中,
后面可以用\l来对捕获的内容进行后向引用:
(\d)\d\l
\l对括号内分组捕获的内容进行了反向引用。这个正则表达式匹配的是区号707。
以下是对该表达式的详细分析:
●(\d)匹配第一个数字并将其捕获(数字7);
●\d匹配第二个数字(数字0)但没有捕获,因为没有括号;
●\l对捕获的数字进行反向引用(数字7)。
(\d)0\l\D\d\d\l\D\l\d\d\d