正则表达式是处理字符串的方法,通过一些特殊符号对特定的字符串进行查找,删除,替换等操作
基础正则表达式元字符
例:
^word 待查找的字符串在行首
word$ 待查找的字符串在行尾
. 代表单个任意字符
* 重复0到无穷个的前一个字符
指的是*前字符无论出现多少次都匹配
\ 转义字符,将特殊符号的特殊意义去除
一开始匹配. 识别成了单个任意字符后来加上了\以后 匹配的就是.这个字符
[list] 从字符集合list中找出想选取的字符或范围
这个意思就是匹配字符串aXcdef 其中X可以为bcdefg其中的任意值
这个意思和上一个命令意思相同,[b-g]和[bcdefg]是一样匹配结果
[^list] 从字符集合list中找出不要的字符串或范围
这个命令是指不要开头为a或b的字符串
\{n,m\} 连续n到m个前一个字符
\{n\} 连续n个前一个字符
\{n,\} 至少n个前一个字符
\{0,m\} 至多m个前一个字符
例:
这个表示a与c之间存在0-4个b的情况就匹配
这个表示a与c之间至少存在2个b的情况就匹配
这个表示a与c之间至多存在2个b的情况就匹配
这个表示a与c之间存在3个b的情况就匹配
除此之外,一些特殊的符号的集合
[:alnum:] 代表英文大小写字符及数字
[:alpha:] 代表英文大小写字符
[:blank:] 代表空格键和TAB按键
[:graph:] 除了空格符(space和tab)外其他所有按键
[:digit:] 代表数字
[:lower:] 代表英文小写字符
[:upper:] 代表英文大写字符
[:punct:] 代表标点符号即’’ ’ ? ! ; : # $
[:space:] 任何会产生空白的字符,包括空格键tab等