正则表达式 捕获型括号和非捕获型括号
对于括号中的子表达式,正则表达式会将匹配的子表达式进行存储。
问题描述
- import re
- PATH='/Users/Michael/.../app_stat.sh'
- CREATE_PATT = '.*?exists.*?(\w+(_\w+)+)\('
- with open(PATH) as fr:
- content = fr.read()
- createPatt = re.compile(CREATE_PATT)
- tables = re.findall(createPatt,content)
- print tables
结果如下:
- [('mds_anti_app_stat','_stat'),('mds_anti_app_blacklist','_blacklist'),('mds_anti_app_mail','_mail'),('mds_anti_app_few_follow','_follow'),('mds_anti_app_mail_spamfan','_sp
- amfan')]
很显然,我想要的结果是
- ['mds_anti_app_stat','mds_anti_app_blacklist','mds_anti_app_mail','mds_anti_app_few_follow','mds_anti_app_mail_spamfan']
由于
(_\w+)+
夹杂这一个括号,导致多匹配了一个结果。
解决方案
将 (_\w+)+
改为 (?:w+)+