我经常忘记正则表达式修饰符m和s及其差异.什么是记住他们的好方法?
据了解,他们是:
‘m’ is for multiline,so that
^
and$
will match beginning of string and end
of string multiple times. (as divided
by\n
)‘s’ is so that the dot will match even
the newline character
通常,我只是使用
/some_pattern/ism
但是,相应地使用它们可能更好(在我的情况下通常是“s”).
你认为什么是记住他们的好方法,而不是忘记哪一个是哪一个?
找到一个正在使用正则表达式多年的人,但仍然不明白这两个修饰符是否正常工作并不罕见.正如你所观察到的,“多行”和“单行”的名称不是很有帮助.他们听起来像是相互排斥的,但是完全独立.我建议你忽略这些名称,并专注于他们做什么:m改变锚的行为(^和$),并改变点(.)的行为.
混合模式的一个突出人物是Ruby的作者.他创建了自己的基于Perl的正则表达式,除了他决定让^和$总是线锚,也就是说,多线模式总是开启的.不幸的是,他也错误地命名了dot-matches-everything模式的多行.所以Ruby没有修饰符,但是它的m修饰符在其他方面做了什么.
至于总是使用/ ism,我建议反对它.如你所发现的那样,它主要是无害的,但它向任何其他人发出了一个令人困惑的信息,他们试图弄清楚正则表达式应该做什么(甚至是在未来).