之前写了一篇有关正则表达式的文章,主要是介绍了正则表达式中通配符转义字符字符集选择符和子模式可选项和重复子模式字符串的开始和结尾 ,有兴趣的可以查看博客内容。
贪心:
使用 .* 匹配字符串
其中标点 . 表示通配符,可以用来匹配除换行符之外的任意符号,* 为重复子模式,允许模式重复0次或者多次;
贪心算法将会按照尽可能大的原则去匹配字符串。
非贪心:
使用 .*? 匹配字符串
其中标点. 表示通配符,可以用来匹配除换行符之外的任意符号,* 为重复子模式,允许模式重复0次或者多次;?为可选项。
举例说明:
使用贪心
import re
<pre style="background-color:#2b2b2b;color:#a9b7c6;font-family:'Consolas';font-size:12.8pt;"><pre name="code" class="python">s="gaxxIxxefahxxlovexxhoghexxpythonxxghaweoif" r=re.compile('xx.*xx') content=r.findall(s) print content
#输出结果 尽可能多地去匹配
['xxIxxefahxxlovexxhoghexxpythonxx']
import re
s="gaxxIxxefahxxlovexxhoghexxpythonxxghaweoif" r=re.compile('xx.*xx') content=r.findall(s) print content
#输出结果
['xxIxx','xxlovexx','xxpythonxx']
s="gaxxIxxefahxxlovexxhoghexxpythonxxghaweoif" r=re.compile('xx(.*?)xx') content=r.findall(s) print content
#输出结果
['I','love','python']
这里使用(.*?)的()括起来的内容为子模式 用来输出