如果图片挂了,请访问:http://www.jianshu.com/p/d989cf2453dd
正则表达式是描述一组字符串特征的模式,用来匹配特定的字符串.
–Ken Thompson
虽然有点抽秀,但是我觉得大家已经模模糊糊的明白了.
你应该有的工具
为了直观的看到你的对错,请使用网站在线正则测试
最笨的”匹配”
我的上一个手机号码是 18615654686,当然,作为天朝子民,前面是有个+86的,这个大家都见过的,现在假设一个场景:
本人的电话被一部2000万字的电子小说引用了,现在需要让你帮我找出在哪里引用了?
解决:你会说,使用搜索,然后输入我的电话,结果自然就出来了.
真是太聪明了!
那我们通过这个在线工具来测试一下我们匹配的过程,请复制以下的内容到测试工具下面的文本框中.
5678456ghju124iewlfjds;fei 饭eieiffds,quentin is so handsome !iof+86 18615654686jewjfejf
没错,这是我在键盘上乱滚出来的结果,什么?有句话说我很帅?纯属天意吧!
然后请你在上面的文本框上输入,进行匹配(现在先忽略掉+86,直接搜索我电话号码):
首先输入 1
,你看到了什么?
对,下面的文本中所有的 1
都被高亮显示了.这个就是它要表达的意思:找出所有符合1
这个模式的文本.
继续输入,直到输入完毕我的电话,现在你看到只是我的电话被高亮了.
好了,你已经完成了我的需求.
需求改了
作为一名开发者,你的领导会这么放过你? NO!
现在我要求: 找出 2000万的文本里面的所有电话,不仅仅是我的,还有 甲乙丙丁… 然后他们的电话我不知道,但都知道是手机号码.
现在,传统的直接搜索的方式的弊端已经出来了.
我们的主角—正则表达式也就出来了.我给你一段测试文本,请再次粘贴到网址的下面的框中.
oinehkjfae;jipwohljewrpijlfdslnadasjlfjew;hjkuifewjoIoUfjsghfslfjdsljfdsljfiesl;fes;hgslgroigjfojfowefpewfkdlsflwfemnfsjldsljfapoepglkwgnsljflskfjjwio13165115639dsfjiejd;asfk;afje;nv;sajfds;ajf18677346767mdsfaekwmfksdmal;fmds;afejnwanfsalfdslk18515651188dsjf;awfjl;jsa;fjdaioejai13165789098js;fkds’afje;wjadfs;fk;dsafjew;fds;afjaw;jidsakldjasf;ldjsafnd;safjkeal;fjdsa;lfjweif;fai;jfiw;afjadl;sjfadls;fjnds;ang;ljggf[aofeo[pfjeoif15949860766
好了,现在请在测试工具的上面的文本框中输入 \d{9,}
,
好的,你可以看到,所有的电话都出来了!(当然,我这里面都是写的电话,复杂的技巧我们将在后面讨论)
下面我们来解释一下上面的表达式:
\d
表示数字(digital)
{}
表示次数列举,比如a{3}
表示 a 出现了3次,a{3,5}
表示 a 出现了3到5次,能匹配 aaa
,aaaa
,aaaaa
这三个结果
那像我的式子,就是 数字出现了9到 N 次