1.正则表达式
正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE)。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串
2.元字符:
元字符 | 正则表达式的写法 | 意义 |
---|---|---|
. | “.” | 任意一个字符 |
^ | “^Spring” | 以Spring开始的字符 |
$ | “EEEE$” | 匹配行结束符,以”EEEE”结束的字符 |
\d | “\d” | 0-9的任何一个数字 |
\D | “\D” | 任何一个非数字字符 |
\s | “\s” | 空白字符,如”\t”,”\n” |
\S | “\S” | 非空白字符 |
\w | “\w” | 可用作标识符的字符,但不包括“$” |
\W | “\W” | 不可用作标识符的字符 |
\p{Lower} | \p{Lower} | 小定字母a-z |
\p{Upper} | \p{Upper} | 大写字母A-Z |
\p{ASCII} | \p{ASCII} | ASCII字符 |
\p{Alpha} | \p{Alpha} | 字母字符 |
\p{Digit} | \p{Digit} | 十进制数字,0-9 |
\p{Alnum} | \p{Alnum} | 数字或字母字符 |
\p{Punct} | \p{Punct} | 标点符号:!“#%&()*=- |
\p{Graph} | \p{Graph} | 可见字符:[\p{Alnum}\p{Punct}] |
\p{Print} | \p{Print} | 可打印字符[\p{Graph}\x20] |
\p{Blank} | \p{Blank} | 空格或制表符:[\t] |
\p{Cntrl} | \p{Cntrl} | 控制字符:[\x00-\x1F\x7F] |
3.方括号
方括号括起来若干个字符来表示一个元字符,该元字符可代表方括号中的任何一个字符。
reg=“[abc]4”—– 则”a4”,”b4”,”c4”,都是和此正则表达式匹配的字符串
方括号例子 | 意义 |
---|---|
[^456] | 代表4,5,6之外的任何字符 |
[a-r] | 代表a~r中的任何一个字母 |
[a-Za-Z] | 代表任意一个英文字母 |
[a-e[g-z]] | 代表a~e或g~z中的任意一个字母 |
[a-o&&[def]] | 代表字母d,e,f(交运算) |
[a-o&&[^bc]] | 代表字母a,d(差运算) |
4.()–小括号
将 () 之间括起来的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。
5.限定修饰符
使用限定修饰符来限定元字符出现的次数
限定修饰符 | 意义 | 示例 |
---|---|---|
? | 0次或1次 | A? |
* | 0次或多次 | A* |
+ | 1次或多次 | A+ |
{n} | 正好出现n次 | A{2} |
{n,} | 至少出现n次 | A{2,} |
{n,m} | 出现n到m次 | A{2,6} |
6.几个样例
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import java.util.regex.PatternSyntaxException;
public class Regular {
//字符串是否是数字
public static String regexIsDigital = “\d+”;
//字符串是否是字母
public static String regexIsAlpha =”\p{Alpha}+”;
//字符串是否是15位或18位的身体证号码
public static String regexIsID=”\d{15}|\d{18}”;
//字符串是否是JJJ开头KKK结尾
public static String regexIsJJJStartKKKEnd=”^JJJ.*KKK$”;
//字符串是否是区号是3或4位数字-(可有可没有)号码任意多少位的数字
public static String regexIsTelePhoneNumber =”[0-9]{3,4}\-?[0-9]+”;
//X@X.com.cn
public static String regexIsEmail = “\w+@\w+(\.\w{2,3})*\.\w{2,3}”;
//字符串是否是汉字
public static String regexIsHanZi=”[\u4e00-\u9fa5]{1,}”;
//查找以Java开头,任意结尾的字符串
public static String regexIsStartJava = “^Java.*”;
//以多条件分割字符串时
public static String regexSplit =”[,|]+”;
public static void main(String[] args) { testIsDigit(); testIsAlpha(); testIsID(); testStartEnd(); testIsTelePhoneNum(); testEmailAddre(); testIsHanZi(); testIsStartJava(); testSplit(); testReplace(); testPattern(); } private static void testPattern() { Pattern pattern = Pattern.compile(""); System.out.println(pattern.matches("[0-9]{6}","200038")); System.out.println(pattern.matches("\\d{6}","200038")); } private static void testReplace() { Pattern pattern = Pattern.compile("正则表达式"); Matcher matcher = pattern.matcher("正则表达式 Hello World,正则表达式 Hello World"); //替换第一个符合正则的数据 System.out.println(matcher.replaceFirst("Java")); pattern = Pattern.compile("正则表达式"); matcher = pattern.matcher("正则表达式 Hello World,正则表达式 Hello World"); //替换所有符合正则的数据 System.out.println(matcher.replaceAll("Java")); } private static void testSplit() { Pattern pattern = Pattern.compile(regexSplit); String data = "Java Hello World Java,Hello,World|Sun"; System.out.println(data+" split by:"+regexSplit); String[] strs = pattern.split(data); for (int i=0;i<strs.length;i++) { System.out.println(strs[i]); } } private static void testIsStartJava() { pressInfoByPattern("Java不是人",regexIsStartJava); pressInfoByPattern("dJava不是人",regexIsStartJava); } private static void testIsHanZi() { pressInfo("验证汉字",regexIsHanZi); } private static void testIsTelePhoneNum() { pressInfo("0733-5544",regexIsTelePhoneNumber); pressInfo("073-566544",regexIsTelePhoneNumber); pressInfo("073566544",regexIsTelePhoneNumber); pressInfo("073--566544",regexIsTelePhoneNumber); } private static void testStartEnd() { pressInfo("JJJKKK",regexIsJJJStartKKKEnd); pressInfo("JJJaaaaKKK",regexIsJJJStartKKKEnd); pressInfo("JJaaaaKKK",regexIsJJJStartKKKEnd); pressInfo("JJJaaaaKK",regexIsJJJStartKKKEnd); } private static void testIsID() { pressInfo("111111111111111",regexIsID); pressInfo("11111111111111",regexIsID); pressInfo("111111111111122221",regexIsID); pressInfo("11111111111112222",regexIsID); } private static void testIsAlpha() { pressInfo("da",regexIsAlpha); pressInfo("d1a",regexIsAlpha); } private static void testIsDigit() { pressInfo("21452",regexIsDigital); pressInfo("21a452",regexIsDigital); pressInfo("021452",regexIsDigital); } private static void testEmailAddre() { pressInfo("aaa@",regexIsEmail); pressInfo("aaaaaaaa",regexIsEmail); pressInfo("11111@11111fffyu.dfg.com",regexIsEmail); } private static void pressInfo(String data,String regex) { if(data.matches(regex)){ System.out.println(data+":is match regex:"+regex); }else{ System.out.println(data+":is not match regex:"+regex); } } private static void pressInfoByPattern(String data,String regex) { Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(data); if(matcher.matches()){ System.out.println(data+":is match regex:"+regex); }else{ System.out.println(data+":is not match regex:"+regex); } }
}
7自己的话
曾经,看到别人能用正则表达式,而自己不会,当时好自卑啊,觉得别人好厉害啊。直到后来,自己坐下来,好好的看了一些正则表达式的资料和例子后,觉得,啊,原来如此。也就是这样,一点都不复杂啊。绝知此事要躬行,古人的话还是有道理的。