403_2@两者取一「|」 @H_403_2@J|A J或A @H_403_2@Java|Hello Java或Hello @H_403_2@「()」中规定一个组合类型 @H_403_2@比如,我查询<a href=/"index.html/">index</a>中<a href></a>间的数据,可写作<a.*href=/".*/">(.+?)</a> @H_403_2@在使用Pattern.compile函数时,可以加入控制正则表达式的匹配行为的参数: @H_403_2@Pattern Pattern.compile(String regex,int flag) @H_403_2@flag的取值范围如下: @H_403_2@Pattern.CANON_EQ 当且仅当两个字符的"正规分解(canonical decomposition)"都完全相同的情况下,才认定匹配。比如用了这个标志之后,表达式"a/u030A"会匹配"?"。默认情况下,不考虑"规 范相等性(canonical equivalence)"。 @H_403_2@Pattern.CASE_INSENSITIVE(?i) 默认情况下,大小写不明感的匹配只适用于US-ASCII字符集。这个标志能让表达式忽略大小写进行匹配。要想对Unicode字符进行大小不明感的匹 配,只要将UNICODE_CASE与这个标志合起来就行了。 @H_403_2@Pattern.COMMENTS(?x) 在这种模式下,匹配时会忽略(正则表达式里的)空格字符(译者注:不是指表达式里的"//s",而是指表达式里的空格,tab,回车之类)。注释从#开始,一直到这行结束。可以通过嵌入式的标志来启用Unix行模式。 @H_403_2@Pattern.DOTALL(?s) 在这种模式下,表达式'.'可以匹配任意字符,包括表示一行的结束符。默认情况下,表达式'.'不匹配行的结束符。 @H_403_2@Pattern.MULTILINE @H_403_2@(?m) 在这种模式下,'^'和'$'分别匹配一行的开始和结束。此外,'^'仍然匹配字符串的开始,'$'也匹配字符串的结束。默认情况下,这两个表达式仅仅匹配字符串的开始和结束。 @H_403_2@Pattern.UNICODE_CASE @H_403_2@(?u) 在这个模式下,如果你还启用了CASE_INSENSITIVE标志,那么它会对Unicode字符进行大小写不明感的匹配。默认情况下,大小写不敏感的匹配只适用于US-ASCII字符集。 @H_403_2@Pattern.UNIX_LINES(?d) 在这个模式下,只有'/n'才被认作一行的中止,并且与'.','^',以及'$'进行匹配。 @H_403_2@抛开空泛的概念,下面写出几个简单的Java正则用例: @H_403_2@◆比如,在字符串包含验证时 @H_403_2@//查找以Java开头,任意结尾的字符串 @H_403_2@ Pattern pattern = Pattern.compile("^Java.*"); @H_403_2@ Matcher matcher = pattern.matcher("Java不是人"); @H_403_2@ boolean b= matcher.matches(); @H_403_2@ //当条件满足时,将返回true,否则返回false @H_403_2@ System.out.println(b); @H_403_2@◆以多条件分割字符串时 @H_403_2@Pattern pattern = Pattern.compile("[,|]+"); @H_403_2@String[] strs = pattern.split("Java Hello World Java,Hello,World|Sun"); @H_403_2@for (int i=0;i<strs.length;i++) { @H_403_2@ System.out.println(strs[i]); @H_403_2@} @H_403_2@◆文字替换(首次出现字符) @H_403_2@Pattern pattern = Pattern.compile("正则表达式"); @H_403_2@Matcher matcher = pattern.matcher("正则表达式 Hello World,正则表达式 Hello World"); @H_403_2@//替换第一个符合正则的数据 @H_403_2@System.out.println(matcher.replaceFirst("Java")); @H_403_2@◆文字替换(全部) @H_403_2@System.out.println(matcher.replaceAll("Java")); @H_403_2@◆文字替换(置换字符)
@H_403_2@StringBuffer sbr = new StringBuffer(); @H_403_2@while (matcher.find()) { @H_403_2@ matcher.appendReplacement(sbr,"Java"); @H_403_2@matcher.appendTail(sbr); @H_403_2@System.out.println(sbr.toString()); @H_403_2@◆验证是否为邮箱地址 @H_403_2@String str="ceponline@yahoo.com.cn"; @H_403_2@Pattern pattern = Pattern.compile("[//w//.//-]+@([//w//-]+//.)+[//w//-]+",Pattern.CASE_INSENSITIVE); @H_403_2@Matcher matcher = pattern.matcher(str); @H_403_2@System.out.println(matcher.matches()); @H_403_2@◆去除html标记 @H_403_2@Pattern pattern = Pattern.compile("<.+?>",Pattern.DOTALL); @H_403_2@Matcher matcher = pattern.matcher("<a href=/"index.html/">主页</a>"); @H_403_2@String string = matcher.replaceAll(""); @H_403_2@System.out.println(string); @H_403_2@◆查找html中对应条件字符串 @H_403_2@Pattern pattern = Pattern.compile("href=/"(.+?)/""); @H_403_2@if(matcher.find()) @H_403_2@ System.out.println(matcher.group(1)); @H_403_2@◆截取http://地址 @H_403_2@//截取url @H_403_2@Pattern pattern = Pattern.compile("(http://|https://){1}[//w//.//-/:]+"); @H_403_2@Matcher matcher = pattern.matcher("dsdsds<http://dsds//gfgffdfd>fdf"); @H_403_2@StringBuffer buffer = new StringBuffer(); @H_403_2@while(matcher.find()){ @H_403_2@ buffer.append(matcher.group()); @H_403_2@ buffer.append("/r/n"); @H_403_2@System.out.println(buffer.toString()); @H_403_2@ @H_403_2@◆替换指定{}中文字 @H_403_2@String str = "Java目前的发展史是由{0}年-{1}年"; @H_403_2@String[][] object={new String[]{"//{0//}","1995"},new String[]{"//{1//}","2007"}}; @H_403_2@System.out.println(replace(str,object)); @H_403_2@public static String replace(final String sourceString,Object[] object) { @H_403_2@ String temp=sourceString; @H_403_2@ for(int i=0;i<object.length;i++){ @H_403_2@ String[] result=(String[])object[i]; @H_403_2@ Pattern pattern = Pattern.compile(result[0]); @H_403_2@ Matcher matcher = pattern.matcher(temp); @H_403_2@ temp=matcher.replaceAll(result[1]); @H_403_2@ } @H_403_2@ return temp; @H_403_2@
}
转自:http://blog.csdn.net/kdnuggets/article/details/2526588