概念
正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。
语法
普通字符
字母、数字、下划线、汉字以及没有特殊定义的标点符号,都是普通字符。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。
简单的转义字符
标准字符集合
能够与‘多种字符’匹配的表达式。
注意区分大小写,大写是取反的意思。例如\D表示任意一个非数字字符。
点号.匹配任意一个字符,但不包括\n。
自定义字符集合
方括号[ ]匹配方式,能够匹配方括号中的任意一个字符。
量词
修饰匹配次数的特殊符号。
匹配次数中的贪婪模式:匹配字符越多越好,默认的模式。
匹配次数中的非贪婪模式:匹配字符越少越好,修饰匹配次数的特殊符号后再加上一个"?"号。例如\d{3,6}?匹配三个数字。
字符边界
......