此快速参考中的每一节都列出了可用于定义正则表达式的字符、运算符和构造的一种特定类别。
-
字符转义
-
字符类
-
定位点
-
分组构造
-
限定符
-
反向引用构造
-
替换构造
-
替换
-
其他构造
正则表达式中的反斜杠字符 (\) 指示其后跟的字符是特殊字符(如下表所示),或应按原义解释该字符。有关更多信息,请参见字符转义。
转义字符 |
说明 | 模式 | 匹配 |
---|---|---|---|
\a |
与报警 (bell) 符 \u0007 匹配。 | \a | “Error!”+“\u0007”中的“\u0007” |
\b | 在字符类中,与退格键 \u0008 匹配。 | [\b]{3,} | “\b\b\b\b”中的“\b\b\b\b” |
\t | 与制表符 \u0009 匹配。 | (\w+)\t | “item1\titem2\t”中的“item1\t”和“item2\t” |
\r | 与回车符 \u000D 匹配。(\r与换行符\n不是等效的。) | \r\n(\w+) | “\r\nThese are\ntwo lines.”中的“\r\nThese” |
\v | 与垂直制表符 \u000B 匹配。 | [\v]{2,102); margin-top:0px; margin-bottom:14px; padding-bottom:0px; line-height:21px; font-size:14px"> “\v\v\v”中的“\v\v\v” | |
\f | 与换页符 \u000C 匹配。 | [\f]{2,102); margin-top:0px; margin-bottom:14px; padding-bottom:0px; line-height:21px; font-size:14px"> “\f\f\f”中的“\f\f\f” | |
\n | 与换行符 \u000A 匹配。 | “\r\nThese are\ntwo lines.”中的“\r\nThese” | |
\e | 与转义符 \u001B 匹配。 | \e | “\x001B”中的“\x001B” |
\nnn | 使用八进制表示形式指定一个字符(nnn最多由三位数字组成)。 | \w\040\w | “a bc d”中的 “a b”和“c d” |
\xnn | 使用十六进制表示形式指定字符(nn恰好由两位数字组成)。 | \w\x20\w | “a bc d”中的 “a b”和“c d” |
\cX \cx |
匹配X或x指定的 ASCII 控件字符,其中X或x是控件字符的字母。 | \cC | “\x0003”中的“\x0003”(Ctrl-C) |
\unnnn | 使用十六进制表示形式匹配 Unicode 字符(由nnnn正确表示的四位数)。 | \w\u0020\w | “a bc d”中的 “a b”和“c d” |
\ | 在后面带有不识别为本主题的此表和其他表中的转义符的字符时,与该字符匹配。例如,\*相同。\x2A,并且,\.相同。\x2E。这允许正则表达式引擎区分语言元素(如 * 或 ?)和字符(用\*或\?表示)。 | \d+[\+-x\*]\d+\d+[\+-x\*\d+ | “(2+2) * 3*9”中的“2+2”和“3*9” |