正则表达式定义了一套完善而复杂的语法规则,用于匹配有特定模式的字符串。在正则表达式中,大部分字符串都匹配自己(即普通字符),只有少量的字符被用于定义特殊的匹配模式语法,他们是:.^$()*+?{}[]\|。
1. 点号(.)可以匹配任意的单个字符,是单字符的通配符。
2. ^匹配行的开头。
3. $匹配行的末尾。
4. ()用于定义一个正则表达式匹配子元素(子表达式),可以被引用或者重复。
5. *表示前面的元素可以重复任意多次(n>=0)。
6. +表示前面的元素可以重复任意一次或多次(n>0)。
7.?表示前面的元素可以重复任意0次或1次(n =0,1)。
8.{}可以手工指定元素重复的次数。{n}重复x=n次,{n,}重复x>=n次,{n,m}重复n次到m次之间的次数,即n<=x<=m.
9. []用于定义字符集合,可以列出单个字符,也可以定义范围,或者是集合的补集[^abc].
10.\是转义字符(与c/c++类似),特殊字符经过转义后与自身匹配。
11.|表示逻辑或的概念,匹配它两侧的元素之一。