这里对正则表达示进行一定程度的总结.为避免太过纠结,这里避开一些 鸡肋 的正则用法.
更多文档参考官方文档 http://docs.oracle.com/javase/8/docs/api/java/util/regex/Pattern.html
字符
x 字符 x
\\ 反斜线字符
\t 制表符 ('\u0009')
\n 新行(换行)符 ('\u000A')
\r 回车符 ('\u000D')
\f 换页符 ('\u000C')
\a 报警 (bell) 符 ('\u0007')
\e 转义符 ('\u001B')
字符类
[abc] a、b 或 c(简单类)
[^abc] 任何字符,除了 a、b 或 c(否定)
[a-zA-Z] a 到 z 或 A 到 Z,两头的字母包括在内(范围)
[a-d[m-p]] a 到 d 或 m 到 p:[a-dm-p](并集)
[a-z&&[def]] d、e 或 f(交集)
[a-z&&[^bc]] a 到 z,除了 b 和 c:[ad-z](减去)
[a-z&&[^m-p]] a 到 z,而非 m 到 p:[a-lq-z](减去)
预定义字符类
. 任何字符(与行结束符可能匹配也可能不匹配)
\d 数字:[0-9]
\D 非数字: [^0-9]
\s 空白字符:[ \t\n\x0B\f\r]
\S 非空白字符:[^\s]
\w 单词字符:[a-zA-Z_0-9]
\W 非单词字符:[^\w]
边界匹配器
^ 行的开头
$ 行的结尾
\b 单词边界
\B 非单词边界
\A 输入的开头
\G 上一个匹配的结尾
\Z 输入的结尾,仅用于最后的结束符(如果有的话)
\z 输入的结尾
/*注:在Java 里表有些特殊的定义,参考API*/
Greedy 数量词 (贪婪)
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好 n 次
X{n,} X,至少 n 次
X{n,m} X,至少 n 次,但是不超过 m 次
Reluctant 数量词 (非贪婪)
X?? X,一次或一次也没有
X*? X,零次或多次
X+? X,一次或多次
X{n}? X,恰好 n 次
X{n,}? X,至少 n 次
X{n,m}? X,至少 n 次,但是不超过 m 次
/*注:Possessive 这里不细说,参考API*/
Logical 运算符
XY X 后跟 Y
X|Y X 或 Y
(X) X,作为捕获组
Java 代码
publicclassTest2{ publicstaticvoidmatch(StringpatternStr,Stringstring){ Patternpattern=Pattern.compile(patternStr); Matchermatcher=pattern.matcher(string); if(matcher.find()){ //matcher.group()==matcher.group(0)代表整个表达示 for(inti=0,j=matcher.groupCount();i<=j;i++){ System.out.println(matcher.group(i)); } } } /** *@paramargs */ publicstaticvoidmain(String[]args){ //字符串区配 Pattern.matches("\\w","abcd"); //字符串替换 "abcdefg".replaceAll("^[\\w]{2}","aaaa"); //字符串筛选 Stringstr="abcde123fgabcd"; match("(\\w+)(\\d+)",str); } }
Oracle相关
--Oracle使用正则表达式的4个函数 --regexp_like(source_char,pattern,[match_parameter]) --与LIKE运算符相似,支持使用与此正则表达式与文本进行匹配 --regexp_substr(source_char,position,[occurrence],[match_parameter]) --为指定字符串的一部分与正则表达式建立匹配 --regexp_instr(source_char,[teturn_option],[match_parameter]) --返回与正则表达式匹配的字符和字符串的位置 --regexp_replace(source_char,replace_string,[match_parameter]) --提供一种修改与所给正则表达式匹配的字符串的方法 --参数说明 --source_char,输入的字符串,可以是列名或者字符串常量、变量。 --pattern,正则表达式。 --match_parameter,匹配选项.取值范围:i:大小写不敏感;c:大小写敏感;n:点号.不匹配换行符号;m:多行模式;x:扩展模式,忽略正则表达式中的空白字符。 --position,标识从第几个字符开始正则表达式匹配。 --occurrence,标识第几个匹配组。 --replace_string,替换的字符串。