本模块提供了正则表达式的匹配操作,它的功能跟Perl语言里的功能一样。
无论是Unicode字符串还是单字节8位组成的字符串,都可以使用模式匹配和字符串查找的功能。不过要注意的是Unicode字符串与8位的字符串不能混合使用,也就是说你不能在Unicode里去匹配单字节的模式,或者其它查找的功能。同样也不能在不同类型的字符串里相互替换字符串。
正则表达式使用反斜线(‘\’)来指定特定的格式的意义,或者是允许使用特定的字符。为了解决使用反斜线(‘\’),它的解决方法跟在字符串格式化里使用一样的方案。比如想匹配双反斜线(‘\\’),就需要使用’\\\\’的格式,因为每两个双反斜线(‘\\’)表示一个斜线。
不过,也可以使用另外一种方法来表示正则表达式的字符串,不用这么麻烦的方法,那就是使用‘r’字符开头来表示原始字符串处理。比如写成r’\n’就是表示两个字符:\和n的字符串,如果没有r开头的字符串’\n’则是表示一个字符的字符串,它表示换行字符。
有一点是要注意的,所有正则表达式的相关函数和方法都在编译正则表达式的对象那节里,但并不是说这些函数和方法需要编译正则表达式才可以使用,而是直接可以使用,不过会有一些性能上损失,或者要多输入一些参数。
蔡军生 QQ:9073204 深圳