正则表达式的使用总结
Linux文本处理三剑客:
grep: 文本过滤工具;
sed:文本编辑器(行);stream editor
awk:文本报告生成器;Linux上awk的实现为gawk
grep:globally search aregularexpressionandprint
作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;
模式:由正则表达式的元字符及文本字符所编写的过滤条件;
分两类:
基本正则表达式:BRE
扩展正则表达式:ERE
正则表达式引擎;
grep [OPTIONS] PATTERN [FILE...]:
选项:
--color=auto:对匹配到的串做高亮显示;
-v:显示模式匹配不到行;
-i: 忽略字符大小写;
-o: 仅显示能够被模式匹配到的串本行;
-q: 静默模式;
-E:使用扩展的正则表达式;
基本正则表达式的元字符:
字符匹配:
.: 匹配任意单个字符;
[]:匹配指定范围内的任意单个字符;
[^]:不匹配指定范围内的任意单个字符;
[:alnum:]文字数字字符
[:alpha:]文字字符
[:digit:]数字字符
[:graph:]非空字符(非空格、控制字符)
[:lower:]小写字符
[:cntrl:]控制字符
[:print:]非空字符(包括空格)
[:punct:]标点符号
[:space:]所有空白字符(新行,空格,制表符)
[:upper:]大写字符
[:xdigit:]十六进制数字(0-9,a-f,A-F)
*: 任意次
\?:0或1次;
\+:1或多次;
\{m\}:精确限制为m次;
\{m,n\}: 至少m次,至多n次,[m,n]
\{0,n\}:至多n次;
.*: 匹配任意长度的任意字符;
位置锚定:
^: 行首锚定;用于模式的最左侧;
$: 行尾锚定;用于模式的最右侧;
\<,\b: 词首锚定;用于表示单词的模式的左侧;
\>,\b:词尾锚定;用于表示单词的模式的右侧;
^$: 空白行;
分组:\(\)
分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1,\2,...
后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;
\1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;
\2:
...
扩展的正则表达式:
grep家庭有三个命令:
grep:基本正则表达式
-E: 扩展正则表达式(等同于egrep命令)
-F:不支持正则表达式(等同于fgrep命令)
egrep:扩展正则表达式
fgrep:不支持正则表达式
扩展正则表达式的元字符:
字符匹配:
.: 匹配任意单个字符;
[]:匹配指定范围内的任意单个字符;
[^]:不匹配指定范围内的任意单个字符;
次数匹配:
*:任意次
?: 0次或1次;
+: 1次以上;
{m}: 精确匹配m次;
{m,n}: 至少m次,至多n次;
锚定:
^: 锚定行首
$: 锚定行尾
分组:()
后向引用:\1,sans-serif;white-space:pre;">或者:
a|b
C|cat: 不表示Cat或cat,而表示C或cat;
要写成(C|c)at
扩展正则表达式主要是简化掉了正则表达式中的转义字符\,除了锚定词首词尾;另外扩展正则表达式加上了“|”的功能
一、作业(练习)内容:
1、总结本此课程中所涉及命令的使用方法及相关示例展示;
2、总结基本正则表达式及扩展正则表达式
grep "bash\>" /etc/passwd
grep --color=auto "\<[0-9]\{2,3\}\>" /etc/passwd
5、显示`netstat -tan`命令结果中以‘LISTEN’后跟0个、1个或者多个空白字符结尾的行
netstat -tan | grep --color=auto "LISTEN[[:space:]]*$"
6、添加用户bash、testbash、basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名与其shell名相同的行
grep "^\([[:alnum:]]\{1,\}\)\>.*\<\1$" /etc/passwd
7、显示当前系统上root、centos或者user1用户的默认shell和UID (请事先创建这些用户,若不存在)
grep -E "^(centos|user1|root)\>" /etc/passwd | cut -d: -f3,6
8、找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行
grep "\<[[:alpha:]]*[_]*[[:alpha:]]*\>()" /etc/rc.d/init.d/functions
9、使用echo输出一个路径,而后egrep找出其路径基名;进一步的使用egrep取出其目录名
echo /etc/rc.d/init.d/functions | egrep -o "[^/]*$"
echo /etc/rc.d/init.d/functions | egrep -o "[^/]*/[^/]*$" | egrep -o "^[^/]*"
10、找出ifconfig命令执行结果中1-255之间的数字
ifconfig | egrep --color=auto "\<([1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])\>"