前言
正则虐我千百遍,我待正则如初见。 ――煌朝
一、被大家视如洪水猛兽的正则表达式到底是什么呢,
1. 从概念上讲,正则表达式是对字符串操作的一种逻辑公式,就是要事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种逻辑过滤。
2. 简单来讲,就是用几个特定字符快速过滤出我们想要得到和看到的内容能够,跟像是添加查询条件。
二、我们为什么要学习正则表达式呢
1. 正则表达式的灵活性,逻辑性和功能性非常的强
2. 可以通过正则表达式,从字符串中获取我们想要的特定部分
3. 可以迅速的用极简单的方式表达到字符串的复杂控制。
三、正则表达式元字符[pattern]
1.^:锚定行首符合条件的内容 "^pattern"
2. $:锚定行为符合条件的内容 "pattern$"
"^pattern$" 锚定pattern
"^$" 表示锚定空白行
3. \?:匹配其前面字符0次或1次
4. \{m,n\}:匹配其前面字符至少m次,至多n次
5. \{0,n\}:匹配其前字符至多n次
6. \{m,\}:匹配器前面字符至少m次
7. \{m\}:精确匹配m次
8. \<:锚定词首,用法格式:\<pattern
等同于\b: \bpattern 匹配以pattern开头的单词
9. \>:锚定词尾,用法格式:pattern\>
等同于\b:pattern\b 匹配以pattern结尾的单词
10. \<pattern\> 匹配单词pattern
11. \(\):分组,用法格式:\(pattern\)
\(ab\)\{1,3\} 匹配ab出现1-3次
12. \(a.b\).*\1 匹配“a.b任意字符a.b” 1表示多个括号时引用第一个括号内的内容
13. .:匹配任意单个字符
14. *:匹配紧挨其前字符任意次,可以不出现
15. .*:匹配任意范围任意长度字符
16. []:匹配指定范围内的任意单个字符
17. [^]:匹配指定范围外的任意单个字符
18. [:space:]空白字符
19. [:digit:]任意数字 [[:digit:]]=[0-9]
20. [:lower:]小写字母 [[:lower:]]=[a-z]
21. [:upper:]大写字母
22. [:alpha:]所有字母
23. [:alnum:]所有数字
24. [:punct:]所有符号
四、grep
1. grep语法
grep [pattern][文件或目录...]
2. grep的选项
--color=auto #过滤出字体添加默认颜色
export GREP_COLOR='01;36' #改变字体默认颜色
-v 反向选取,只显示不符合模式的行
-i 不区分大小写
-B #显示前面的#行
-C #显示前面和后面的#行
-E 使用扩展的正则表达式
注:我理解grep跟正则表达式的关系
正则表达式是一种表达式,是一种逻辑;grep是支持正则表达是的一个命令,一种工具
五、光看元字符和grep选项是不是已经看蒙圈了呢,下面我们举些例子简单说明下:
1. 找出/proc/meminfo文件中以不区分大小写的s开头的行;
[root@localhost ~]# grep --color=auto -i "^[s]" /proc/meminfo
解释:--color=auto 给过滤出的字体加默认颜色,-i表示不区分大小写,""里面表示过滤内容
2. 找出/etc/passwd中以nologin结尾的行
[root@localhost ~]# grep --color=auto "nologin$" /etc/passwd
解释:""中写需要过滤内容,$表示以前面的内容做为行尾,也可以加-o 只显示过滤内容
3. 找出/etc/rc.d/rc.sysinit中以#开头,且后面跟了空白字符,而后又跟了任意非空白字符的行
[root@localhost ~]# grep "^#[[:space:]][^[:space:]]*" /etc/rc.d/rc.sysinit
解释:^#以“#”开头,[[:space:]],表示一个或多个空白字符,[^[:space:]]非空白字符
4. 找出/etc/passwd中以一个字母开头,并且以开头字母结尾的行
[root@localhost ~]# grep --color=auto "\(^[a-z]\).*\1$" /etc/passwd
解释:前面的\(..\)表示括号内的内容为一个选定词,后面\1表示引用第一个()内的词
原文链接:https://www.f2er.com/regex/361774.html