(一)grep:正则表达式
Linux文本处理三剑客:
grep: 文本过滤工具;
sed:文本编辑器(行);stream editor
awk:文本报告生成器;Linux上awk的实现为gawk
grep: Global search REgular expression and Print out the line.
作用:文本搜索工具,根据用户指定的“模式(pattern)”逐行去搜索目标文本,打印匹配到的行;
模式:由正则表达式的元字符及文本字符所编写的过滤条件;
分两类:
基本正则表达式:BRE
扩展正则表达式:ERE
语法格式:grep [OPTIONS] PATTERN [FILE...]:
选项:
--color=auto:对匹配到的串做高亮显示;
-v:显示模式匹配不到行;
-o: 仅显示能够被模式匹配到的串而非行;
基本正则表达式的元字符:
字符匹配:
.: 匹配任意单个字符;
[]:匹配指定范围内的任意单个字符;
[^]:匹配指定范围内的任意单个字符;
[:lower:]:所有小写字母
[:upper:]:所有大写字母
[:alpha:]:所有字母
[:alnum:]:所有数字和字母
[:digit:]:所有数字
[:space:]:所有空白字符
[:punct:]:所有标点符号
\?:0或1次;
grep "x\?y"
\+:1或多次;
\{m\}:精确限制为m次;
\{m,n\}: 至少m次,至多n次,[m,n]
\{0,n\}:至多n次;
\{m,\}:至少m次;
.*: 匹配任意长度的任意字符;
位置锚定:
^: 行首锚定;用于模式的最左侧;
$: 行尾锚定;用于模式的最右侧;
\<,\b: 词首锚定;用于表示单词的模式的左侧;
\>,\b:词尾锚定;用于表示单词的模式的右侧;
^$: 空白行;
分组:\(\)
分组的小括号中的模式匹配到的内容,会在执行过程中被正则表达式引擎记录下来,并保存内置的变量中;这些变量分别是\1,\2,...
\1: 从左侧起,第一个左括号,以及与之配对的右括号中间的模式所匹配到的内容;
\2:
...
后向引用:使用变量引用前面的分组括号中的模式所匹配到的字符;
(二)扩展的正则表达式:egrep
注:扩展正则表达式的使用方法基本相同只有部分参数是不需要添加\转意符使用的,
如下:
次数匹配
?: 0次或1次;
+: 1次以上;
{m}: 精确匹配m次;
{m,n}: 至少m次,至多n次;
分组:()
或者:a|b
C|cat: 不表示Cat或cat,而表示C或cat;要写成(C|c)at
练习:
正则表达式: #grep ‘\(bash\)\>’/etc/passwd
@H_403_224@
扩展正则表达式 #egrep ‘(bash)\>’/etc/passwd
正则表达式:#grep -o '[0-9]\{2,3\}' /etc/passwd
扩展正则表达式:# egrep -o '[0-9]{2,3}' /etc/passwd
3.显示‘netstat�tan ’命令结果中以‘LISTEN’后跟0个、1个或多个空白字符结尾的行;
正则表达式:# netstat -tan|grep '\(LISTEN\)[[:space:]]\?\+'
扩展正则表达式:# netstat -tan|egrep '(LISTEN)[[:space:]]?+'
4.添加用户bash,testbash,basher以及nologin用户(nologin用户的shell为/sbin/nologin);而后找出/etc/passwd文件中用户名同shell名的行;
正则表达式:# grep '^\(.*\):.*\1$'/etc/passwd
扩展正则表达式:# egrep '^(.*):.*\1$'/etc/passwd
扩展正则表达式练习题:
1.显示当前系统上root、centos或user1用户的默认shell和UID;
# egrep '^(root):|(centos):|(user1):' /etc/passwd |cut -d:-f3,7
2.找出/etc/rc.d/init.d/functions文件中某单词(单词中间可以存在下划线)后面跟着一组小括号的行;
正则表达式:# grep'\([[:alpha:]]\+_*[[:alpha:]]\+\)()'/etc/rc.d/init.d/functions
扩展正则表达式:#egrep'([[:alpha:]]{1,}_{0,}[[:alpha:]]{1,})\(\)' /etc/rc.d/init.d/functions
3.使用echo输出一个路径,而后egrep找出其路径基名;
进一步地:使用egrep取出其目录名
取基名:
#echo /etc/init.d/functions | egrep --color=auto -o '[[:alnum:]]+$'
#echo /etc/init.d/functions/ | egrep --color=auto -o '[[:alnum:]]+/?$'
取路径名
# echo /etc/init.d/functions |egrep --color=auto -o '^.*+/'
4.找出ifconfig命令执行结果中1-255之间的数字
#ifconfig | egrep --color=auto -o "/<[1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-5][0-5]/>"