1. 基础字符串切割
要求:
按照空格将字符串切割
String a = "asd adsf asdf dfkajsd yyy";
String reg1 = " +"; //1个或多个空格切割
String[] val = a.split(reg1);
for(String v : val){
System.out.println(v);
}
2. 按照特殊字符切割
要求:
按照点将字符串切割
特别说明:
在正则表达式中,. 为特殊字符,所以必须转义\. ,而在java字符串中\ 如果想正常表示也需要转义,就成为\\.
String b = "abc.sd.s.ldj.l44.sd";
String reg2 = "\\.";
String[] val1 = b.split(reg2);
for(String v : val1){
System.out.println(v);
}
3.按照叠词完成切割,为了规则的结果可以被重用
要求:
按照有重复的字符串切割
特别说明:
正则表达式中()中的内容表示一个组,而组后面跟上\1 表示组的编号,此处表示重用组里规则过滤出来的值,这个就叫叠词
String c = "sdflddfkdfguuuflglglhlsgfaszzdk";
String reg3 = "(.)\\1+"; // 组里为任意字符,\\1为重用组里过滤出来的值,+表示多次利用组里规则过滤出来的值
String [] val2 = c.split(reg3);
for(String v : val2){
System.out.println(v);
}
补充:
如下面正则表达式: ((a(b))(c))
怎么判断它是几个组呢?
答: 只要数它有几个左括号或者几个右括号就行了,这里是4个组;
那么怎么知道组的编号了?
答:从左至右数左括号,第一个就是第一组,一次类推。
总结补充:这个正是正则表达式的一个缺点,就是符号定义越多,正则越长,阅读行越差。说白了就是越牛的正则表达式越难看明白。