介绍:首先说下正则表达式的语法组成,及各个元素的含义。
还有三个字符的用法 补充在后面
如上图:
1.字符 . 表示可以匹配任意字符(除了\n) 即在正则表达式中如果出现了 . 则在要匹配的字符串这个对应位置可以是任意字符
2.[ ] 中括号中可以放入一个字符串,代表可以匹配这个字符串中的任意一个字符
例: [abcd] 即可以匹配abcd中任意一个字符 注:如果要匹配A到Z之间任意一个字符可以写 作[A-Z] 同理[a-z] [0-9]
3.\d可以匹配任意一个数字 \D可以匹配任意一个非数字 同理 \s 空白字符指空格、换行、tab \S \w \W
4. *指匹配前一个字符无限次
例:[\d]* 指可以匹配0-9 任意一个数字无限次 同理[ ] 中可以放\s \w 等 + ? 用法同 *
5. {m}匹配前一个字符m次
例:[\d]{5} 指可以匹配0-9任意一个数字5次 {m,n}指匹配前一个字符m到n次
6. +? 因为*指匹配前一个字符1次或者是无限次 所以+?指匹配前一个字符1次后 尽可能不匹配前一个字符 *? ??用法同前
例:[\d]+? 待匹配字符串为45621 匹配结果为4
7. | 匹配左右任一个表达式
例:163|126 待匹配字符串为163则输出结果为163 带匹配字符串为126 则输出结果为126
8. (ac)将表达式分组
例:asd(dd1) 则dd1为一个分组可以单独操作 正则表达式 :[\w]{4,10}@(163|126|qq).com 待匹配表达式7855@163.com 待匹配表达式中163可以换为126或者qq
9.\<number> 引用编号为num的分组匹配到的字符串
例:正则表达式 :<([\w]{4}>)\1([\w]{3}>)\2 待匹配字符串<book>book>fff>fff> 第一个()中的字符串由\1 引用 第二个()中的字符串由\2引用
10(?P<name>) 分组起一个别名 (?P=name)引用别名为name的串
例:正则表达式<(?P<mark>[\w]{4}>)[\w]+</(?P=mark) 待匹配串 <book>python</book> 给第一个括号内的取名为mark 在第二个括号内引用
11. ^ 匹配字符串开头 即待匹配字符串的开头必须按照正则表达式的要求形式
$ 匹配字符串结尾即待匹配字符串的结尾必须按照正则表达式的要求形式
例:正则表达式 [\w]{4,10}@163.com$ 待匹配字符串的结尾必须是@163.com不能多 也不能少
12 \A or \Z 指定的字符串必须出现在开头 or 结尾
\Z同理加在结尾
例: 正则表达式 \A sdff[\w]* 待匹配字符串sdff456ss可以匹配 asdff456ss无法匹配
以上