第七章、grep及正则表达式
04_04_grep及正则表达式
@H_403_22@
@H_403_22@grep家族: grep,egrep,fgrep
Pattern:文本字符和正则表达式的元字符组合而成匹配条件
@H_403_22@grep [options] PATTERN [FILE...]
@H_403_22@-i:忽略大小写
--color:匹配到的字符带颜色
-v::显示没有被模式匹配到的行
-o:只显示被模式匹配到的字符串
通配符:
1. *:任意长度的任意字符
2. ?:任意单个字符
@H_403_22@3. []:
@H_403_22@4. [^]:@H_403_22@正则表达式:REGular EXPression,REGEXP
@H_403_22@元字符:
1. .:匹配任意单个字符
2. []:匹配指定范围内的任意单个字符
3. [^]:匹配指定范围外的任意单个字符
字符集合:[:digit:],[:lower:],[:upper:],[:punct:],[:space:],[:alpha:],[:alnum:]
匹配其前面的字符任意次
e.g: 有:a,b,ab,aab,acb,adb,amnb,下面pattern会匹配那些字符串?
a*b: b,aab
a?b: b,ab
a.*b: ab,amnb
.*:任意长度的任意字符
2. \?:匹配其前面的字符1次或0次
3. \{m,n\}:匹配其前面的字符至少m次,至多n次
\{1,\} - 至少1次
\{0,3\} - 至多3次
@H_403_22@位置锚定:
1. ^:锚定行首,此字符后面的任意内容必须出现在行首
2. $:锚定行尾,此字符前面的任意内容必须出现在行尾
^$:空白行
3. \<或\b:锚定词首,其后面的任意字符必须作为单词首部出现
4. \>或\b:锚定词尾,其前面的任意字符必须作为单词的尾部出现
@H_403_22@分组:
@H_403_22@\(\)
\(ab\)*:ab作为整体,出现n次
后向引用
\2:
\3:
e.g:
@H_403_22@He love his lover.
@H_403_22@She like her liker.
@H_403_22@He like his lover.
@H_403_22@grep '\(l..e\).*\1' test.txt 匹配到1,2行
@H_403_22@练习:
1、显示/proc/meminfo文件中以不区分大小的s开头的行;
@H_403_22@grep -i '^s' /proc/meminfo
@H_403_22@grep '^[sS]' /proc/meminfo
2、显示/etc/passwd中以nologin结尾的行;
@H_403_22@grep 'nologin$' /etc/passwd
取出默认shell为/sbin/nologin的用户列表
@H_403_22@grep "nologin$' /etc/passwd | cut -d: -f1
取出默认shell为bash,且其用户ID号最小的用户的用户名
@H_403_22@grep 'bash$' /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1
3、显示/etc/inittab中以#开头,且后面跟一个或多个空白字符,而后又跟了任意非空白字符的行;
@H_403_22@grep "^#[[:space:]]\{1,\}[^[:space:]]" /etc/inittab
4、显示/etc/inittab中包含了:一个数字:(即两个冒号中间一个数字)的行;
@H_403_22@grep ':[0-9]:' /etc/inittab
5、显示/boot/grub/grub.conf文件中以一个或多个空白字符开头的行;
@H_403_22@grep '^[[:space:]]\{1,\}' /boot/grub/grub.conf
6、显示/etc/inittab文件中以一个数字开头并以一个与开头数字相同的数字结尾的行;
@H_403_22@grep '^\([0-9]\).*\1$' /etc/inittab
1、找出某文件中的,1位数,或2位数;
@H_403_22@grep '[0-9]\{1,2\}' /proc/cpuinfo
@H_403_22@grep --color '\<[0-9]\{1,2\}\>' /proc/cpuinfo
2、找出ifconfig命令结果中的1-255之间的整数;
@H_403_22@需要使用扩展正则表达式
@H_403_22@ifconfig | egrep --color '\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-9][0-9])\>'
3、查找当前系统上名字为student(必须出现在行首)的用户的帐号的相关信息,文件为/etc/passwd
@H_403_22@grep '^student\>' /etc/passwd | cut -d: -f3
@H_403_22@id -u student
@H_403_22@student1
@H_403_22@student2
练习:
分析/etc/inittab文件中如下文本中前两行的特征(每一行中出现在数字必须相同),请写出可以精确找到类似两行的模式:
@H_403_22@l1:1:wait:/etc/rc.d/rc 1
@H_403_22@l3:3:wait:/etc/rc.d/rc 3
@H_403_22@grep '^l\([0-9]\):\1.*\1$' /etc/inittab
05_01_egrep及扩展正则表达式
复习:
REGEXP:REGular EXPression
@H_403_22@Pattern:模式
@H_403_22@正则表达式:
Basic REGEXP:基本
Extended REGEXP:扩展
@H_403_22@基本正则表达式:
@H_403_22@.:
@H_403_22@[]:
@H_403_22@[^]:
@H_403_22@*:
\?: 0或1次
\{m,n\}:至少m次,至多n次;
@H_403_22@.*:
@H_403_22@锚定:
@H_403_22@^:
@H_403_22@$:
@H_403_22@\<,\b:
@H_403_22@\>,'Microsoft YaHei';">\1,\2,\3,...
@H_403_22@grep:使用基本正则表达式定义的模式来过滤文本的命令;
-i
-v
-o
--color
-E:使用扩展正则表达式
-A n: 显示匹配到的行和其后的n行
-B n: 前的n行
-C n: 前后各n行
@H_403_22@扩展正则表达式:省略很多反斜线
@H_403_22@字符匹配:
@H_403_22@.
@H_403_22@[]
@H_403_22@[^]
@H_403_22@?:
+:匹配其前面的字符至少1次,\{1,\}
@H_403_22@{m,n}:
@H_403_22@位置锚定:
@H_403_22@^
@H_403_22@$
@H_403_22@\<
@H_403_22@\>
分组:
():分组
@H_403_22@或者
@H_403_22@|: or
C|cat:C或cat, 不是Cat或cat,这个用 '(C|c)at'
@H_403_22@grep -E = egrep
bash特性详解时的未解问题
@H_403_22@ls .*[^[[:space:]].*[0-9]$
找出/boot/grub/grub.conf文件中1-255之间的数字;
@H_403_22@\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>
找出ifconfig中的IP地址
@H_403_22@ifconfig | egrep '\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'
@H_403_22@ifconfig | egrep --color '(\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>\.){3}\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>'
找出ifconfig中的ABC 3类IP地址
@H_403_22@IPv4:
5类:A B C D E
A:1-127
B:128-191
C:192-223
@H_403_22@\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[01][0-9]|22[0-3])\>(\.\<([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>){2}\.\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-4])\>