这篇博文我们按照每一种正则表达式符号来整理。
1)行首定位符“^”:匹配行首的字符
#-----------------------------/chapter8/ex8-2.sh------------------ #! /bin/bash #列出/etc目录中的以字母po开头的文件 str=`ls /etc | grep "^po"` echo "$str"
注意:str变量的赋值,即等号右边需要有反引号;其中用到了管道命令,grep命令处理对象是前面ls的结果,不然grep后面要接被处理文件名;正则表达式要用双引号""括起来,在awk、sed中是用两条反斜杠\...\括起来。
2)行尾定位符"$":匹配行尾的字符
#-----------------------------/chapter8/ex8-3.sh------------------ #! /bin/bash #列出/etc目录中以conf结尾的文件名 str=`ls /etc | grep "conf$"` echo "$str"
3)匹配整行:"^一整行内容$"
4)单个字符匹配".":可以代表任意字符,包括空格,不包括换行符\n
#-----------------------------/chapter8/ex8-4.sh------------------ #! /bin/bash #列出所有的包含字符串“samba”的文件名 str=`ls /etc | grep "samba"` echo "$str" echo "===============================" #列出包含字符串samba以及另外一个字符的文件名 str=`ls /etc | grep "samba."` echo "$str"
注意:有了"."就表示一定有个字符在这儿,也可以用多个"."表示多个字符存在,例如"l..p"。
5)限定符"*":重复其前面的字符0次或者多次
#-----------------------------/chapter8/ex8-5.sh------------------ #! /bin/bash #筛选出以字符s开头,紧跟着1个字符s,任意个字符s的文件名 str=`ls /etc | grep "^sss*"` echo "$str"
注意:可以表达重复0次;正则表达式的*和linux shell中的*不一样,那个是表示匹配任意字符(串),不一定要是重复前面的字符,可以说范围更广。
6)字符集匹配“[]”:匹配中括号中的任意一个字符即可
#-----------------------------/chapter8/ex8-6.sh------------------ #! /bin/bash #筛选所有以字符r开头,并且紧跟着1个字符c的文本行 str=`ls /etc |grep "^rc"` echo "$str"<pre name="code" class="plain">#-----------------------------/chapter8/ex8-7.sh------------------ #! /bin/bash #筛选以字符串“ss”开头,后面至少紧跟着1个字符“s”的文本行 str=`ls /etc | egrep "^sss+"` echo "$str"
注意:[a-z]匹配小写字母,[A-Z]匹配大写字母,[a-zA-Z]匹配字母,[0-9]匹配数字。
当元字符“*”和 “.”在"[]"内时,只能表示一个普通的字符,没有上面的特殊含义了。
7)字符集不匹配“[^]”:功能和上面正好相反
8)限定符“+”:功能类似于"*",但是重复前面字符的次数必须大于等于1次,不能是0次
#-----------------------------/chapter8/ex8-7.sh------------------ #! /bin/bash #筛选以字符串“ss”开头,后面至少紧跟着1个字符“s”的文本行 str=`ls /etc | egrep "^sss+"` echo "$str"
9)限定符“?”:功能类似于“*”,但是重复其那面字符的次数必须只能是0次或1次
#-----------------------------/chapter8/ex8-8.sh------------------ #! /bin/bash #筛选以字符串“ss”开头,后面跟着0或者1个s的文本行 str=`ls /etc | egrep "^sss?"` echo "$str"
10)竖线"|"和圆括号"()":多个正则表示之间的或的关系
#-----------------------------/chapter8/ex8-9.sh------------------ #! /bin/bash #筛选含有字符串“ssh”、“ssl”或者以字符串“yum”开头的文本行 str=`ls /etc | egrep "(ssh|ssl|^yum)"` echo "$str"
11)"{m,n}"、"{m}"、"{m,}":指定重复出现的次数
前面的限定符"*","+","?"都可以重复前面的字符不同的次数,但是重复出现的次数都不可控。我们使用"{m,}"就可以控制重复出现的次数。
"{m,n}":前置字符最少出现m次,最多出现n次;
"{m}":前置字符出现m次;
"{m,}":前置字符最少出现m次。
如果重复的字符不是唯一的呢?这时可以和中括号字符集匹配"[]"结合使用,如下:
#-----------------------------/chapter8/ex8-16.sh------------------ #! /bin/bash #筛选符合格式的电话号码 str=`egrep "800-[[:digit:]]{3}-[[:digit:]]{4}$" demo4.txt` echo "$str"
注意:在普通正则表达式中没有对{}的定义,需要加转义字符:\{m,n\}。
12)POSIX字符集可以方便表示"[]"的字符集
注意:使用POSIX字符集时需要两层中括号。