对于复杂的字符串处理,如果我们单过使用String类对她进行我们需要的处理会变得十分困难,编写代码会变的十分繁杂,此时,我们可以使用正则表达式来处理这样的问题。
java中的java.util.regex包中对正则表达式进行了描述。这个包中主要包含两个类,一个Pattern,一个Mathcer。其中Pattern可以理解为一个分装好的正则表达式实例对象,Mathcer可以理解为指定字符串与正则表达式匹配后产生的一个匹配器,他内部提供了很多对匹配后的结果的操作。使用起来比较便捷。
使用Pattern与Matcher的操作步骤如下:
1.创建Pattern对象,该对象是由Pattern编译指定的正则表达式后产生的。
2.将获得的Pattern对象与我们需要比较的字符串进行匹配,产生一个Mathcer对象。
3.根据我们的需求,调用Matcher的方法,达到我们的目标。
比如,我们需要比较将例如“aabbbccddeeeeeffg”字符串转换成”abcdefg”,我们可以这么做
String str = "aabbbccddeeeeeffg"; Pattern pattern = Pattern.compile("([a-z])\\1+"); Matcher matcher = pattern.matcher(str); str = matcher.replaceAll("$1"); sop(str);当然,我们也可以直接使用String提供的replaceAll方法来实现这个功能:
String str = "aabbbccddeeeeeffg"; str = str.replaceAll("([a-z])\\1+","$1"); sop(str);如果我们查看String的repalceAll源码,我们会发现,他底层就是使用了Pattern与Matcher。
上述代码的正则表达式用到了组合的概念,用()括起来的就是一个组,后面我们可以通过组号来调用前面的组内容,避免重复写代码,组号是根据左括号出现的位置决定的,第一个左括号到与之对应右括号为第一组,第二个左括号到与之对应的右括号为第二组,以此类推...我们可以使用\+组号的形式来调用,需要注意的是\是特殊字符,需要使用\来转义。
处理字符串主要有以下几种操作:
1.匹配:用于判断是否与我们指定的形式符合。主要方法 matches()
2.替换:将一有字符串变换成另一种字符串,元素基本跟已有字符串一致。主要方法 replaceAll()
3.切割:根据自己的需求将字符串分割成多个字符串。主要方法 split()
习题:
/* * 将IP字符串“192.168.1.150 2.2.2.2 10.16.48.123 56.78.123.253”按照网段顺序输出 * 思路: * 1.使用String的split方法将各个IP地址分割开来。 * 2.由于IP的每一段长度都不一样,无法进行准确的比较,我们需要将IP地址的每段都设置成3位, * 先给IP地址的每段前面添加两个0,然后取后三位,这样就可以统一起来。 * 3.使用集合存放字符串输出,由于需要有顺序,所以使用TreeSet存放。 */ import java.util.*; import java.util.regex.*; class IPSortDemo { public static void main(String[] args) { String str = new String("192.168.1.150 2.2.2.2 10.16.48.123 56.78.123.253"); str = str.replaceAll("([0-9]{1,3})","00$1"); str = str.replaceAll("0+([0-9]{3})","$1"); TreeSet<String> ts = new TreeSet<String>(); String[] arr_str = str.split(" "); for(String s : arr_str){ ts.add(s); } Iterator iterator = ts.iterator(); while(iterator.hasNext()){ String temp = (String)iterator.next(); sop(temp.replaceAll("0*(<a target=_blank target="_blank" href="file://\\d">\\d</a>+)","$1")); } } public static void sop(Object obj){ System.out.println(obj); } }