第七章、grep及正则表达式

前端之家收集整理的这篇文章主要介绍了第七章、grep及正则表达式前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

第七章、grep及正则表达式


04_04_grep及正则表达式


grep家族: grep,egrep,fgrep

grep:根据模式搜索文本,并将符合模式的文本行显示出来。

Pattern:文本字符和正则表达式的元字符组合而成匹配条件

grep [options] PATTERN [FILE...]

-i:忽略大小写

--color:匹配到的字符带颜色

-v::显示没有被模式匹配到的行

-o:只显示被模式匹配到的字符串

通配符:

1. *:任意长度的任意字符

2. ?:任意单个字符

3. []:

4. [^]:正则表达式:REGular EXPression,REGEXP

元字符:

1. .:匹配任意单个字符

2. []:匹配指定范围内的任意单个字符

3. [^]:匹配指定范围外的任意单个字符

字符集合:[:digit:],[:lower:],[:upper:],[:punct:],[:space:],[:alpha:],[:alnum:]

匹配次数(贪婪模式):

匹配其前面的字符任意次

e.g: 有:a,b,ab,aab,acb,adb,amnb,下面pattern会匹配那些字符串?

a*b: b,aab

a?b: b,ab

a.*b: ab,amnb

.*:任意长度的任意字符

2. \?:匹配其前面的字符1次或0次

3. \{m,n\}:匹配其前面的字符至少m次,至多n次

\{1,\} - 至少1次

\{0,3\} - 至多3次

位置锚定

1. ^:锚定行首,此字符后面的任意内容必须出现在行首

2. $:锚定行尾,此字符前面的任意内容必须出现在行尾

^$:空白行

3. \<或\b:锚定词首,其后面的任意字符必须作为单词首部出现

4. \>或\b:锚定词尾,其前面的任意字符必须作为单词的尾部出现

分组:

\(\)

\(ab\)*:ab作为整体,出现n次

后向引用

\1:引用第一个左括号以及与之对应的右括号所包括的所有内容

\2:

\3:

e.g:

He love his lover.

She like her liker.

He like his lover.

grep '\(l..e\).*\1' test.txt 匹配到1,2行

练习:

1、显示/proc/meminfo文件中以不区分大小的s开头的行;

grep -i '^s' /proc/meminfo

grep '^[sS]' /proc/meminfo

2、显示/etc/passwd中以nologin结尾的行;

grep 'nologin$' /etc/passwd

取出默认shell为/sbin/nologin的用户列表

grep "nologin$' /etc/passwd | cut -d: -f1

取出默认shell为bash,且其用户ID号最小的用户用户名

grep 'bash$' /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1

3、显示/etc/inittab中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;

grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/inittab

4、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;

grep ':[0-9]:' /etc/inittab

5、显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行;

grep '^[[:space:]]\{1,\}' /boot/grub/grub.conf

6、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;

grep '^\([0-9]\).*\1$' /etc/inittab

1、找出某文件中的,1位数,或2位数;

grep '[0-9]\{1,2\}' /proc/cpuinfo

grep --color '\<[0-9]\{1,2\}\>' /proc/cpuinfo

2、找出ifconfig命令结果中的1-255之间的整数;

需要使用扩展正则表达式

ifconfig | egrep --color '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-9][0-9])\>'

3、查找当前系统上名字为student(必须出现在行首)的用户的帐号的相关信息,文件为/etc/passwd

grep '^student\>' /etc/passwd | cut -d: -f3

id -u student

student1

student2

练习:

分析/etc/inittab文件中如下文本中前两行的特征(每一行中出现在数字必须相同),请写出可以精确找到类似两行的模式:

l1:1:wait:/etc/rc.d/rc 1

l3:3:wait:/etc/rc.d/rc 3

grep '^l\([0-9]\):\1.*\1$' /etc/inittab

05_01_egrep及扩展正则表达式


复习:

REGEXP:REGular EXPression

Pattern:模式

正则表达式:

Basic REGEXP:基本

Extended REGEXP:扩展

基本正则表达式:

.:

[]:

[^]:

次数匹配:

*:

\?: 0或1次

\{m,n\}:至少m次,至多n次;

.*:

锚定:

^:

$:

\<,\b:

\>,'Microsoft YaHei';">\1,\2,\3,...

grep:使用基本正则表达式定义的模式来过滤文本的命令;

-i

-v

-o

--color

-E:使用扩展正则表达式

-A n: 显示匹配到的行和其后的n行

-B n: 前的n行

-C n: 前后各n行

扩展正则表达式:省略很多反斜线

字符匹配:

.

[]

[^]

次数匹配:

?:

+:匹配其前面的字符至少1次,\{1,\}

{m,n}:

位置锚定:

^

$

\<

\>

分组:

():分组

或者

|: or

C|cat:C或cat, 不是Cat或cat,这个用 '(C|c)at'

grep -E = egrep

4、显示所有以数字结尾且文件名中不包含空白的文件

bash特性详解时的未解问题

ls .*[^[[:space:]].*[0-9]$

找出/boot/grub/grub.conf文件中1-255之间的数字;

\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>

找出ifconfig中的IP地址

ifconfig | egrep '\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'

ifconfig | egrep --color '(\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.){3}\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'

找出ifconfig中的ABC 3类IP地址

IPv4:

5类:A B C D E

A:1-127

B:128-191

C:192-223

\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[01][0-9]|22[0-3])\>(\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>){2}\.\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>


马哥51cto博客: http://mageedu.blog.51cto.com/

fgrep:快速grep,不支持正则表达式

猜你在找的正则表达式相关文章