import java.util.regex.*;
public class RegExPrac { public static void main(String[] args) { String str = "1588344570615883445706"; Matcher m = Pattern.compile("(((13\\d)|(15\\d))\\d{8})+?").matcher(str); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }
Pattern.compile是一个类方法,查阅API文档可知,compile有两种重载,一种是compile(String regex),另一种多一个参数compile(String regex,int flags),flags是一个用以约束的描述符,有一些宏与其对应。compile返回一个 Pattern对象,Pattern没有可见的构造器。Pattern有一些方法,不过不是重点,Pattern对象保存着compile的参数,可以产生Matcher对象,Matcher对象是重点。
Matcher的构造器也是不可见的,只能通过Pattern对象的matcher(String str)方法产生Matcher实例,Pattern为什么可以调用Matcher的构造器?我表示疑惑,有空研究一下源码。
find():文档中这样说:Attempts to find the next subsequence of the input sequence that matches the pattern. 即是在输入的序列中去找“下一个”匹配模版的子序列。这里的“找”如果找到了,则把结果存在某处,返回一个true,用group()方法就可以把这个已经存好的结果输出。find()从头到位把序列检查一遍之后就不再检查,之后会一直输出false。使用find(int start)可以设定一个起始位置重新开始查找。
比如最上方的代码,((13\\d)|(15\\d))\\d{8} 表示“13x开头,或者15x开头,后面有八个x” x代表数字。其实也可以写成((13)|(15))\\d{9}。把这个式子括起来,加上数量表示符“+?”。加号表示的条件是:前面的式子出现一次或者多次。问号表示“勉强模式”:匹配最少的字符。所以这个条件就是寻找模版只出现一次的情况。
start at : 0;end at :11 output : 15883445706
start at : 11;end at :22 output : 15883445706
while(m.lookingAt()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); }就会一直循环下去,检查开头----匹配-----输出-----检查开头-----匹配-----输出……
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "1588344570615883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})+").matcher(str); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }可以看到,正则表达式尾部的数量表示符只有一个“+”,表示此式子出现一次或者多次,加号之后没有其他限定,默认采用“贪婪模式”,即允许的范围内尽量多,所以会匹配“多次”,而“多次”这个概念没有上限,所以会匹配到无法匹配为止。
start at : 0;end at :22 output : 1588344570615883445706
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "1588344570615883d445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})?").matcher(str);//零次或一次,贪婪模式 // System.out.println(m.groupCount()); // m.matches(); // System.out.println(m.start(0)); // System.out.println(m.start(1)); // System.out.println(m.start(2)); // System.out.println(m.start(3)); // m.lookingAt(); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }结果是:
start at : 0;end at :11 output : 15883445706
start at : 11;end at :-1 output :
start at : 12;end at :-1 output :
start at : 13;end at :-1 output :
start at : 14;end at :-1 output :
start at : 15;end at :-1 output :
start at : 16;end at :-1 output :
start at : 17;end at :-1 output :
start at : 18;end at :-1 output :
start at : 19;end at :-1 output :
start at : 20;end at :-1 output :
start at : 21;end at :-1 output :
start at : 22;end at :-1 output :
start at : 23;end at :-1 output :
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "158d8344570615883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})?").matcher(str); // System.out.println(m.groupCount()); // m.matches(); // System.out.println(m.start(0)); // System.out.println(m.start(1)); // System.out.println(m.start(2)); // System.out.println(m.start(3)); m.lookingAt(); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }结果是:
start at : 1;end at :-1 output :
start at : 2;end at :-1 output :
start at : 3;end at :-1 output :
start at : 4;end at :-1 output :
start at : 5;end at :-1 output :
start at : 6;end at :-1 output :
start at : 7;end at :-1 output :
start at : 8;end at :-1 output :
start at : 9;end at :-1 output :
start at : 10;end at :-1 output :
start at : 11;end at :-1 output :
start at : 12;end at :23 output : 15883445706
start at : 23;end at :-1 output :
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "158d8344570615883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})??").matcher(str); m.matches(); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }输出结果是:
start at : 3;end at :-1 output :
start at : 4;end at :-1 output :
start at : 5;end at :-1 output :
start at : 6;end at :-1 output :
start at : 7;end at :-1 output :
start at : 8;end at :-1 output :
start at : 9;end at :-1 output :
start at : 10;end at :-1 output :
start at : 11;end at :-1 output :
start at : 12;end at :-1 output :
start at : 13;end at :-1 output :
start at : 14;end at :-1 output :
start at : 15;end at :-1 output :
start at : 16;end at :-1 output :
start at : 17;end at :-1 output :
start at : 18;end at :-1 output :
start at : 19;end at :-1 output :
start at : 20;end at :-1 output :
start at : 21;end at :-1 output :
start at : 22;end at :-1 output :
start at : 23;end at :-1 output :
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "1588344570615883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})+?").matcher(str);//一次或多次,勉强模式 m.matches(); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }结果是什么也没有输出。虽然是数量表示符是+?,即一次或多次并使用勉强模式,但是matches()还是把整个字符串都匹配进去了。同样的,如果数量表示符是*?,在“零次或多次,勉强模式”的条件下,matches()一样把整个字符串匹配进去了。
package c71; import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "1588344570615883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})??").matcher(str); System.out.println(m.matches()); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }结果是:
start at : 11;end at :-1 output :
start at : 12;end at :-1 output :
start at : 13;end at :-1 output :
start at : 14;end at :-1 output :
start at : 15;end at :-1 output :
start at : 16;end at :-1 output :
start at : 17;end at :-1 output :
start at : 18;end at :-1 output :
start at : 19;end at :-1 output :
start at : 20;end at :-1 output :
start at : 21;end at :-1 output :
start at : 22;end at :-1 output :
start at : 0;end at :22 output : 1588344570615883445706
start at : 22;end at :-1 output :
start at : 0;end at :11 output : 15883445706
start at : 11;end at :22 output : 15883445706
start at : 22;end at :-1 output :
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "15883445706df15883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})?").matcher(str); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }
start at : 0;end at :11 output : 15883445706start at : 11;end at :-1 output :
start at : 12;end at :-1 output :
start at : 13;end at :24 output : 15883445706
start at : 24;end at :-1 output :
import java.util.regex.*; public class RegExPrac { public static void main(String[] args) { String str = "1588344570615883445706"; Matcher m = Pattern.compile("(((13)|(15))\\d{9})*?").matcher(str); while(m.find()) { System.out.println("start at : " + m.start() + ";end at :" + m.end(1) + " output : " + m.group()); } } }*?表示零次或多次并使用“勉强模式”,即匹配“零次”,结果是
start at : 0;end at :-1 output :
start at : 1;end at :-1 output :
start at : 2;end at :-1 output :
start at : 3;end at :-1 output :
start at : 4;end at :-1 output :
start at : 5;end at :-1 output :
start at : 6;end at :-1 output :
start at : 7;end at :-1 output :
start at : 8;end at :-1 output :
start at : 9;end at :-1 output :
start at : 10;end at :-1 output :
start at : 11;end at :-1 output :
start at : 12;end at :-1 output :
start at : 13;end at :-1 output :
start at : 14;end at :-1 output :
start at : 15;end at :-1 output :
start at : 16;end at :-1 output :
start at : 17;end at :-1 output :
start at : 18;end at :-1 output :
start at : 19;end at :-1 output :
start at : 20;end at :-1 output :
start at : 21;end at :-1 output :
start at : 22;end at :-1 output :
同时, 可以用start()、end()方法分别输出当前匹配的结果在源字符串中的起始位置和结束位置,结束位置是字符串最后一个字符位置再往后一位,java的习惯。
group,start,end三个方法都有带参数的重载,比如group(int group),start(int group),end(int group),这些参数好像只有在matches检查整个字符串之后才有意义,而group到底是怎么分,怎么算的,暂时还没弄明白。