「^」这个符号在正则表达式的中的应用相信是所有程序员都掌握的, 因为它是正则表达式中最基础最常用的知识点。
它在正则表达式中表示两种不同的意义
1
表示匹配一段文本开头的位置,注意, 匹配的是一个位置, 而不是具体的某个字符,「 匹配位置」在正则表达式中有很重要的意义。
这个正则表达式就是用来匹配以小写的「a」开头的字符串, 如「alibaba」,但不能匹配「baidu」,「^」代表的是字符串第一个字母前面那个用肉眼看不见的位置。
2
以上面这个正则表达式为例,一般情况下我们会使用两种思路去理解
-
不匹配「a」和「b」开头的字符串
-
匹配除「a」和「b」以外的所有字符串开头的字符串
通过这两种思路去理解这个正则表达式, 最终的答案都是一样的,也是正确的。 我们思考问题的逻辑思路更倾向于第一种理解方式。
然而, 对于整套正则表达式体系理念来说, 第一种理解方式是错误的。 在正则表达式理念中, 只有去「匹配」些什么, 从来没有「不匹配」这一说法,这一点是必须要区分清楚的。
当我们处理正则问题时, 在梳理逻辑时将「匹配」与「不匹配」混杂在一起,势必会增加处理问题的复杂度, 对于简单的问题受到的影响也许不是很明显 , 就像上面举的例子那样, 因为还在我们智力的承受范围内,但碰到复杂的问题时, 就会像掉进沼泽一样, 怎么爬也爬不出来, 最终被困死在泥潭中。但是,假如只是以单纯的「匹配」去理解,就能简化处理问题的难度,降低复杂度,2肯定比1复杂。 因此,正则表达式最重要的核心理念就是「匹配」
另外,在程序设计中用到的替换、切割、查找等操作, 都是程序类库封装的功能, 和正则表达式本身半毛钱关系也没有。 理解「匹配」也就意味着对学习正则表达式的入门。