-- Start
如果你还不知道什么是正则表达式或者不是很清楚,请先阅读正则表达式精萃。
ksh 的正则表达式和其他语言有一些区别,最重要的区别是,在 ksh 中, ? 代表任意一个字符,* 代表任意多个字符,那么它如何匹配次数呢?看看下面的表格吧。
操作符 描述 *(exp) 贪婪匹配,匹配任意次 +(exp) 贪婪匹配,匹配 1次或多次 ?(exp) 贪婪匹配,匹配 0或1次 {N}(exp) 贪婪匹配,匹配 N 次 {N,M}(exp) 贪婪匹配,匹配 N 到 M 次 @(exp1|exp2|...) 贪婪匹配,匹配 exp1 或 exp2 ... *-(exp) 非贪婪匹配,匹配任意次 +-(exp) 非贪婪匹配,匹配 1次或多次 ?-(exp) 非贪婪匹配,匹配 0或1次 {N}-(exp) 非贪婪匹配,匹配 N 次 {N,M}-(exp) 非贪婪匹配,匹配 N 到 M 次 @-(exp1|exp2|...) 非贪婪匹配,匹配 exp1 或 exp2 ... !(exp) 匹配非 exp 的任何东西 [:word:] 匹配字母或下划线 \d 匹配数字,同[[:digit:]] \D 匹配非数字,同[![:digit:]] \s 匹配空白字符,同[[:space:]] \S 匹配非空白字符,同[![:space:]] \w 匹配匹配字母或下划线,同[[:word:]] \W 匹配非匹配字母或下划线,同[![:word:]]
下面是使用正则表达式的一个简单例子。
#!/bin/ksh ################################ 匹配 typeset brithday='2013-06-25'; if [[ ${brithday} = {4}(\d)-{2}(\d)-{2}(\d) ]]; then print "legal date" fi ################################ 替换 typeset str="Zhang yi,zhang er,Zhuang Si,ZHANG WU"; # ${xx/pattern/replace} pattern 是个正则表达式,将变量 xx 中 pattern 匹配的字串替换成 replace 指定的字符串,非贪婪模式 print "\${xx/pattern/replace} : ${str/Z*(\w)/C\1}"; # ${xx//pattern/replace} 同上,贪婪模式 print "\${xx//pattern/replace} : ${str//Z*(\w)/C\1}"; # ~(+i:pattern) 表示 pattern使用忽略大小写匹配模式 print "\${xx//pattern/replace} : ${str//~(+i:Z*(\w))/C\1}"; # ksh 不支持 行首,行尾,单词边界 正则表达式,下面的方式实现了类似功能 # ${xx/#pattern/replace} pattern 是个正则表达式,从变量 xx 开头查找 pattern 匹配的字串替,如果找到则换成 replace 指定的字符串,非贪婪模式 print "\${xx/#pattern/replace} : ${str/#Z*(\w)/C\1}"; # ${xx/%pattern/replace} pattern 是个正则表达式,查找变量 xx 是否以 pattern 匹配的字串替结尾,如果找到则换成 replace 指定的字符串,非贪婪模式 print "\${xx/%pattern/replace} : ${str/%?(\w)/*}"; ################################ 删除子串 # ${xx/pattern} pattern 是个正则表达式,删除变量 xx 中 pattern 匹配的子串,非贪婪模式 print "\${xx/pattern} : ${str/Z*(\w)}"; # ksh 不支持 行首,行尾,单词边界 正则表达式,下面的方式实现了类似功能 # ${xx#pattern} pattern 是个正则表达式,从变量 xx 开头查找 pattern 匹配的字串替,如果找到则删除,非贪婪模式 print "\${xx#pattern} : ${str#Z*(\w)}"; # ${xx##pattern} 同上,贪婪模式 print "\${xx##pattern} : ${str##Z*(\w)}"; # ${xx%pattern} pattern 是个正则表达式,查找变量 xx 是否以 pattern 匹配的字串替结尾,如果找到则删除,非贪婪模式 print "\${xx%pattern} : ${str%W*(\w)}"; # ${xx%%pattern} 同上,贪婪模式 print "\${xx%%pattern} : ${str%%W*(\w)}";
上面介绍的正则表达式有个缺陷,它只能匹配英语,如果你想匹配其他语言,你可以使用标准的 POSIX 语法,如下。
元字符(Metacharacter) 匹配(Matches) [[:alnum:]] 字母和数字 [[:alpha:]] 字母 [[:lower:]] 小写字母 [[:upper:]] 大写字母 [[:digit:]] 数字 [[:blank:]] 空格和制表符 [[:space:]] 空白字符 [[:graph:]] 非空白字符 [[:print:]] 类似[[:graph:]],但是包含空白字符 [[:punct:]] 标点符号 [[:cntrl:]] 控制字符 [[:xdigit:]] 十六进制中容许出现的数字(例如 0-9a-fA-f) [. xx .] 将 xx 作为一个整体匹配,xx 可以是任何字母 [= e =] 认为等价,在法语中匹配 e,è,或 é
-- 更多参见:ksh精萃
--声 明:转载请注明出处
-- Last Updated on 2015-10-10
-- Written by ShangBo on 2015-09-25 -- End