正则表达式的简单梳理

前端之家收集整理的这篇文章主要介绍了正则表达式的简单梳理前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。


这篇博文我们按照每一种正则表达式符号来整理。

1)行首定位符“^”:匹配行首的字符

#-----------------------------/chapter8/ex8-2.sh------------------
#! /bin/bash

#列出/etc目录中的以字母po开头的文件
str=`ls /etc | grep "^po"`
echo "$str"

注意:str变量的赋值,即等号右边需要有反引号;其中用到了管道命令,grep命令处理对象是前面ls的结果,不然grep后面要接被处理文件名;正则表达式要用双引号""括起来,在awk、sed中是用两条反斜杠\...\括起来。


2)行尾定位符"$":匹配行尾的字符

#-----------------------------/chapter8/ex8-3.sh------------------
#! /bin/bash

#列出/etc目录中以conf结尾的文件名
str=`ls /etc | grep "conf$"`

echo "$str"

3)匹配整行:"^一整行内容$"


4)单个字符匹配".":可以代表任意字符,包括空格,不包括换行符\n

#-----------------------------/chapter8/ex8-4.sh------------------
#! /bin/bash

#列出所有的包含字符串“samba”的文件名
str=`ls /etc | grep "samba"`

echo "$str"

echo "==============================="

#列出包含字符串samba以及另外一个字符的文件名
str=`ls /etc | grep "samba."`

echo "$str"

注意:有了"."就表示一定有个字符在这儿,也可以用多个"."表示多个字符存在,例如"l..p"。


5)限定符"*":重复其前面的字符0次或者多次

#-----------------------------/chapter8/ex8-5.sh------------------
#! /bin/bash

#筛选出以字符s开头,紧跟着1个字符s,任意个字符s的文件名
str=`ls /etc | grep "^sss*"`

echo "$str"

注意:可以表达重复0次;正则表达式的*和linux shell中的*不一样,那个是表示匹配任意字符(串),不一定要是重复前面的字符,可以说范围更广。


6)字符集匹配“[]”:匹配中括号中的任意一个字符即可

#-----------------------------/chapter8/ex8-6.sh------------------
#! /bin/bash

#筛选所有以字符r开头,并且紧跟着1个字符c的文本行
str=`ls /etc |grep "^rc"`

echo "$str"<pre name="code" class="plain">#-----------------------------/chapter8/ex8-7.sh------------------
#! /bin/bash

#筛选以字符串“ss”开头,后面至少紧跟着1个字符“s”的文本行
str=`ls /etc | egrep "^sss+"`

echo "$str"

 

注意:[a-z]匹配小写字母,[A-Z]匹配大写字母,[a-zA-Z]匹配字母,[0-9]匹配数字。

当元字符“*”和 “.”在"[]"内时,只能表示一个普通的字符,没有上面的特殊含义了。


7)字符集不匹配“[^]”:功能和上面正好相反


8)限定符“+”:功能类似于"*",但是重复前面字符的次数必须大于等于1次,不能是0次

#-----------------------------/chapter8/ex8-7.sh------------------
#! /bin/bash

#筛选以字符串“ss”开头,后面至少紧跟着1个字符“s”的文本行
str=`ls /etc | egrep "^sss+"`

echo "$str"

9)限定符“?”:功能类似于“*”,但是重复其那面字符的次数必须只能是0次或1次

#-----------------------------/chapter8/ex8-8.sh------------------
#! /bin/bash

#筛选以字符串“ss”开头,后面跟着0或者1个s的文本行
str=`ls /etc | egrep "^sss?"`

echo "$str"


10)竖线"|"和圆括号"()":多个正则表示之间的或的关系

#-----------------------------/chapter8/ex8-9.sh------------------
#! /bin/bash

#筛选含有字符串“ssh”、“ssl”或者以字符串“yum”开头的文本行
str=`ls /etc | egrep "(ssh|ssl|^yum)"`

echo "$str"

11)"{m,n}"、"{m}"、"{m,}":指定重复出现的次数

前面的限定符"*","+","?"都可以重复前面的字符不同的次数,但是重复出现的次数都不可控。我们使用"{m,}"就可以控制重复出现的次数

"{m,n}":前置字符最少出现m次,最多出现n次;

"{m}":前置字符出现m次;

"{m,}":前置字符最少出现m次。

如果重复的字符不是唯一的呢?这时可以和中括号字符集匹配"[]"结合使用,如下:

#-----------------------------/chapter8/ex8-16.sh------------------
#! /bin/bash

#筛选符合格式的电话号码
str=`egrep "800-[[:digit:]]{3}-[[:digit:]]{4}$" demo4.txt`

echo "$str"

注意:在普通正则表达式中没有对{}的定义,需要加转义字符:\{m,n\}。


12)POSIX字符集可以方便表示"[]"的字符集


注意:使用POSIX字符集时需要两层中括号。

猜你在找的正则表达式相关文章