正则表达式是一个强大的字符串处理工具,可以对字符串尽心查找提取分割替换的操作。String类中也提供了几个特殊的方法:
Booleanmatches(Stringregex)判断字符串是否符合指定的正则表达式
StringreplaceAll(Stringregex,Stringreplacement)将所有的匹配的之前的regex替换成之后的字符串就是将前者换成后者
这些特殊的方法都依赖java中的正则表达式,除此之外java还提供了Pattern和matcher的支持两个类专门用于提供志恒则表达式的支持
正则表达式是一种很简单而且实用的工具。正则表达式是一个用于匹配字符串的模板。实际上任意字符串都可以当成正则表达式使用例如字符串“ABC”就是一个正则表达式这样的正则表达式就是只能匹配ABC在正则表达式中可已使用通配符,正则表达式中的通配符远远的超出了通配符的功能被称为预定义字符
“【】”方括号表达式表示的是枚举【abc】表示匹配abc中的任何一个
“-”表示范围比如【a-z】表示的就是如果你想要使用a-z之间的任意字符那么就是用这个
“^”表示求否,【^abc】表示的是不造abc中选择
“&&”表示与运算【a-z&&【def】】表示的是去取a-z和def的交集如果想要使用匹配所有中文字符就可以使用【\\u0041-\\u0056】所有中文的unicode都是连续的这样的话就能使用这样的方式匹配所有的中文字符正则表达式还支持原括号表达式,用于将多和表达是组成一个子表达式圆括号中可以使用或运算符
如果要建立一个匹配000-000-0000使用正则表达式\\d\\d\\d-\\d\\d\\d-\\d\\d\\d\\d正则表达式这样的看起来比较繁琐实际上正则表达式还提供了数量表示符
Greedy(贪婪模式):数量表示符默认采用贪婪模式除非另有表示贪婪模式的表达式将会一直匹配下去直到无法匹配为止
Reluctant(最小匹配模式)这样的模式用问号(?)后缀表示只会匹配最少的字符
Possessive(占有模式)通常较少的使用
使用正则表达式:
一旦在程序中定义了正则表达式那么就可以使用Pattern和Matcher来使用正则表达式。
Pattern对像是正则表达式编译后在内存中的表示形式,因此正则表达式字符串必须先要被编译成pattern对像然后再利用pattern对像创建Martcher执行匹配所涉及的状态保留在Matcher对象中,多个Matcher对象可以共享一个对象
创建的方法如下:
//将字符串编译成Pattern对像
Patternp=Pattern.compile(“a*b”);
//使用pattern对像创建Matcher对像
Matcherm=p.matcher(aaaaaaabBooleanb=a.matches();//返回true
上面定义的Pattern对像可以多次使用,如果某个正则表达式仅需要使用一次,则可以直接使用Pattern类的静态方法matches()使一个字符串编译成一个匿名的Pattern对像并执行匹配如下代码:
Booleanb=Pattern.matches(,aaab上面的一句就是最上面三句的组合
Pattern是不可变类,可提供多个并法线程安全使用
Matcher类提供了如下几个常用的方法:
Find():返回目标字符串中是否包含和Pattern匹配的子串
Group():返回上一次和Pattern匹配的字符串
Start():返回上一次和Pattern匹配的子串在目标字符串的开始的位置。
End():和上面的相反返回最后的
Matcher():返回整合目标自古穿与Pattern是否匹配
Reset():将现有的Matcher对像用于一个新的字符串序列
通过Matcher的find()和group()方法可以从目标字符串依次取出特子串(匹配正则表达式的子串就想互联网爬虫一样)
PublicclassFindGroup{
Publicstaticvoidmain(String[]aegs){
Stringstr=我有一本书叫做java,尽快联系我我的电话13500006666+交朋友电话15322223636;
Matcherm=Pattern.compile(((13\\d|15\\d))\\d{8}While(m.find()){
System.out.println(m.group());
}
上面的输出的结果就是电话号码
从上面的结果了一看出来,find()方法一次找到字符串中pattern匹配的字符串找到对应的子串,下次调用find()方法是将接着向下查找
如果想要更加深入的理解请参考相应专门介绍的网站