正则表达式中的{ } （） [] 及re.match re.search

1.正则表达式相关说明

() 是为了提取匹配的字符串。表达式中有几个()就有几个相应的匹配字符串。

(\s*)表示连续空格的字符串。

(\d*)表示连续的数字，与[0-9]+类似

[]是定义匹配的字符范围。比如 [a-zA-Z0-9] 表示相应位置的字符要匹配英文字符和数字。[\s*]表示空格或者*号。

{}一般用来表示匹配的长度，比如 \s{3} 表示匹配三个空格，\s[1,3]表示匹配一到三个空格。

(0-9) 匹配 '0-9′ 本身。 [0-9]* 匹配数字（注意后面有 *，可以为空）[0-9]+ 匹配数字（注意后面有 +，不可以为空）{1-9} 写法错误。

[0-9]{0,9} 表示长度为 0 到 9 的数字字符串

关于[]* 与[]+的示例：

[]*可以返回控制，即可以找不到值，但是[0-9]+不可以为空，如果为空返回错误

>>> c='GET /diviner?pin=1123066825_m&p='
>>> r=re.search('p=([0-9]+)',c)
>>> print r.group(1)
Traceback (most recent call last):
File "<stdin>",line 1,in <module>
AttributeError: 'NoneType' object has no attribute 'group'
>>> print r
None
>>> r=re.search('p=([0-9]*)',c)
>>> print r.group(1)

----此处返回为空

2.re mathc search说明

match（）函数只检测RE是不是在string的开始位置匹配，

search()会扫描整个string查找匹配；

>>> a='123aaabcabcabc'
>>> import re
>>> re.search('abc',a)
<_sre.SRE_Match object at 0x7fd7534184a8>
>>> re.mathc('abc',a)
Traceback (most recent call last):
File "<stdin>",in <module>
AttributeError: 'module' object has no attribute 'mathc'
>>> re.match('abc',a)
>>> b=re.match('abc',a)
>>> print b
None
>>> b=re.match('1',a)
>>> pint b
File "<stdin>",line 1
pint b
^
SyntaxError: invalid Syntax
>>> print b
<_sre.SRE_Match object at 0x7fd7534188b8>

()在对于group groups的作用---主要起到分组的作用

>>> c='GET /diviner?pin=1123066825_m&p=61234'>>> r=re.search('p=((\d*))',c)>>> print c.group(0)Traceback (most recent call last): File "<stdin>",in <module>AttributeError: 'str' object has no attribute 'group'>>> print r.group(0)p=61234>>> r=re.search('p=((\d*))',c)>>> r=re.search('p=([0-9]*)',c)>>> r=re.search('p=[0-9]*',c)>>> print r.group<built-in method group of _sre.SRE_Match object at 0x7fd7534189f0>>>> print r.group(0)p=61234>>> print r.group(1)---无括号无分组Traceback (most recent call last): File "<stdin>",in <module>IndexError: no such group>>> r=re.search('p=([0-9]*)',c)>>> print r.group(1)61234

正则表达式中的{ } （） [] 及re.match re.search

猜你在找的正则表达式相关文章