截取作者c++部分原文地址

什么是正则表达式？

正则表达式(RegularExpression)就是用某种模式去匹配一类字符串的公式。如你要在一篇文章中查找第一个字是“李”最后一个字是“明”的三个字的姓名，即“李*明”；那么“李*明”就是公式，也称作模式(Pattern)，这篇文章就是要匹配的串(或叫文本text)。再如，你要检查输入的一个字符串是否是126邮箱的格式，你得制定一个规则去查检，这种规则就是正则表达式。

我们就从上面提到的一个例子开始：检查一个字符串是否符合126邮箱的格式。

我们从网易的邮箱注册页面可以看到126邮箱的用户名需要符合以下的格式：6~18个字符，可使用字母、数字、下划线，需以字母开头。我们可以定义一个模式：^[a-zA-Z]\w{5,17}@126.com

这个模式可以这样理解：

[a-zA-Z]：任何一个a到z或A到Z的英文字母

^：表示以什么开头，则^[a-zA-Z]表示以字母开头

\w：单词字符[a-zA-Z_0-9]，即a-z或A-Z或0-9或_中的任何一个字符

{5,17}：表示出现5到17次(至少5次，不超过17次)，则\w{5,17}表示5~17个字符。

因为还有一个以非数字字母开头的字符，所以^[a-zA-Z]\w{5,17}表示：“6~18个字符，可使用字母、数字、下划线，需以字母开头”

@126.com：表示符合以上规则的用户名后跟上@126.com字符串，即组成一个邮箱地址。

“ ^[a-zA-Z]\w{5,17}@126.com ”就是我们所说的正则表达式。

正则表达式常用符号

上面一个示例中用到的“^”、“\w”、“{5,17}”等都是正则表达式中的常用符号，这些符号在正则表达式中都有特殊的含意。下面这个表格是Java中的正则表达式常用符号的含意(只抽取了其常用的部分进行说明，就这些部分其实可以解决关于正则表达式的绝大多数的问题了)。

模式	匹配的内容(含意)

字符类
[abc]	a、b或c（简单类）
[^abc]	任何字符，除了a、b或c（否定）
[a-zA-Z]	a到z或A到Z，两头的字母包括在内（范围）
[a-d[m-p]]	a到d或m到p：[a-dm-p]（并集）
[a-z&&[def]]	d、e或f（交集）
[a-z&&[^bc]]	a到z，除了b和c：[ad-z]（减去）
[a-z&&[^m-p]]	a到z，而非m到p：[a-lq-z]（减去）

预定义字符类
.	任何字符（与行结束符可能匹配也可能不匹配）
\d	数字：[0-9]
\D	非数字：[^0-9]
\s	空白字符：[\t\n\x0B\f\r]
\S	非空白字符：[^\s]
\w	单词字符：[a-zA-Z_0-9]
\W	非单词字符：[^\w]

边界匹配器
^	行的开头
$	行的结尾
\b	单词边界
\B	非单词边界
\A	输入的开头
\G	上一个匹配的结尾
\Z	输入的结尾，仅用于最后的结束符（如果有的话）
\z	输入的结尾

数量词(Greedy策略)
X?	X，一次或一次也没有
X*	X，零次或多次
X+	X，一次或多次
X{n}	X，恰好n次
X{n,}	X，至少n次
X{n,m}	X，至少n次，但是不超过m次

逻辑运算符
XY	X后跟Y
X\|Y	X或Y
(X)	X，作为捕获组

参考文档：ClassPattern

这些常用的符号在各种编程语言的正则表达式中含意基本相同(因为正则表达式的思想是相同的)，所以都可以用来参数。但不同的语言可能会有一些细小的差别，如果要针对各种编程语言，想有更精确和权威的说明，可参考其官方文档：

C++(VS2013编译器)：http://msdn.microsoft.com/zh-cn/library/bb982727.aspx#grammarsummary

正则表达式的使用

下面从常见的需求出发讲述C++、Java和JavaScript中正则表达式的使用

C++中的正则表达式

C++中正则表达式主要有三种实现方式：C语言的实现方式(Cregex)，C++标准库的实现(C++regex)，Boost库的实现(boostregex)。Cregex的方式是一种面向过程的编程方式，使用起来不太方便；C++regex的方式因为是标准库的一部分，所以可以直接使用(好像Linux平台下不支持)，但C++regex非常难用，语法要求比较严格，而且好多默认的选项和我们正常的想法不一样；Boost是一个开源的第三方库，这个库非常优秀，广泛应用于C++的项目开发中，boostregex非常灵活好用，C++开发时是大家推崇的一种方式。

关于boostregex的用法，在后继的文章将会进一步介绍，现在以C++regex的方式列举一个使用样例。

1.验证ip地址

[cpp]view plaincopyprint? 
   
 #include<regex>
 #include<iostream>
 #include<string>
 
 boolIsIpV4Address(conststd::string&strIp)
 {
 //验证IP地址的模式，这里"\."中的"\"是转义字符,表示这是一个.
 conststd::regexpattern("(\\d{1,3}){1}\.(\\d{1,3}){1}");
//匹配验证
returnstd::regex_match(strIp,pattern);
 }
intmain()
 std::stringstrIp1="134.34.34.4";//192.168.1.1
 std::stringstrIp2="192.168.255";
 
 std::cout<<strIp1<<":"<<(IsIpV4Address(strIp1)?"valid":"invalid")<<std::endl;
 std::cout<<strIp2<<":"<<(IsIpV4Address(strIp2)?"valid":"invalid")<<std::endl;
return0;
 } 

什么是正则表达式？浅谈 c++中的正则表达式

截取作者c++部分原文地址

什么是正则表达式？

正则表达式常用符号

正则表达式的使用

C++中的正则表达式

猜你在找的正则表达式相关文章