一个正则表达式就是由普通字符(例如字符a到z)以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。
例如下面一些正则表达式:
^(-?\d+)(\.\d+)?$ 匹配浮点数
^[A-Za-z]+$匹配由26个英文字母组成的字符串
^[A-Z]+$ 匹配由26个英文字母的大写组成的字符串
^[a-z]+$ 匹配由26个英文字母的小写组成的字符串
^[A-Za-z0-9]+$ 匹配由数字和26个英文字母组成的字符串
^\w+$ 匹配由数字、26个英文字母或者下划线组成的字符串
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ 匹配email地址
当然,可能你会问上面这些表达式为什么是这样写。这里就暂时不做多讲,因为本文主要讲的是PCRE库的应用,所以想了解更多的话,可以看我下面的[附录1],里面有全部正则表式用到的元字符说明。或参考网址[3]正则表达式语言元素msdn文档。