简单的正则表达式匹配 Regular Expression Matching

前端之家收集整理的这篇文章主要介绍了简单的正则表达式匹配 Regular Expression Matching前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

题目源自于Leetcode。

只需要支持两个匹配符*和.。

'.' Matches any single character.
'*' Matches zero or more of the preceding element.

本题的要求是能够全部匹配整个母字符串,而不是包含有

The matching should cover the entire input string (not partial).


思路:母字符串和模式串双指针移动。会遇到最大的难点在于模式串遇到 .* 之后,母字符串该如何向后移动的问题,因为.*太灵活了,只有先知道之后的匹配情况才能对.*进行适合的匹配,因此存在一个回溯的问题

把循环改成递归,是一种很常用的策略。

若当前问题可以判定结果,则返回判定结果;

若在当前问题无法确定、需要依赖于之后的问题的时候,使用返回递归来求解之后的问题。


代码

class Solution {
public:
    bool isMatch(const char *s,const char *p) 
    {   
        if (s == NULL || p == NULL) 
            return false;
        if (*p == '\0') 
            return *s == '\0';
     
        if (*(p + 1) == '*') //当前出现任意匹配
        {
            while ((*s != '\0' && *p == '.') || *s == *p) //出现.*
            {
                if (isMatch(s,p + 2)) 
                    return true;
                ++s;
            }
            return isMatch(s,p + 2);
        }
        else if ((*s != '\0' && *p == '.') || *s == *p) //当前是正常匹配or.匹配
        {
            return isMatch(s + 1,p + 1);
        }
        else //当前是错误匹配
            return false;
    }
};

代码注释:

比较关键的一处是第11行为什么要用while循环。

首先要知道while循环的是母字符串从当前位置开始~直到~遇到不匹配或结尾的所有字符。为什么要这样?因为正则匹配符*是任意次数的匹配,我自己并不知道到底应该匹配多少次,所以只能每一次可以的匹配都做一遍,即每个状态空间子树都尝试一下。这些状态空间子树,注定是失败居多,少数或唯一一个成功,只要有一个子树是匹配的,当前状态就是匹配的。


这个逻辑是挺难理解的,多看几次。递归思想+分治思想。

1、考虑递归结束条件,即最原子化的问题。

2、只关注当前问题,子问题交给递归来做。

原文链接:https://www.f2er.com/regex/362467.html

猜你在找的正则表达式相关文章