频道导航

re-正则表达式模块

2020-07-02 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了re-正则表达式模块，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

import re

预定义字符集：

\d：数字[0-9]

\D：非数字[^\d]

\s：空白字符[<空格>\t\r\n\f\v]

\S：非空白字符[^\s]

\w：单词字符[A-Za-z0-9_]

\W：非单词字符[^\w]

匹配数量：

.：匹配除换行符以外的任何单个字符

*：匹配前一个字符0或无限次(尽可能多的匹配)

*?：尽可能少的进行匹配前边的正则表达式

+：匹配前一个字符1次或无限次(尽可能多的匹配)

+?：尽可能少的进行匹配前边的正则表达式

?：匹配前一个字符0次或1次(尽可能多的匹配)

??：尽可能少的进行匹配前边的正则表达式

{m}：匹配前一个字符m次

{m,n}：匹配前一个字符m至n次(尽可能多的匹配)

{m,n}?：尽可能少的进行匹配前边的正则表达式

\：转义字符

?P<name>R:R表示为正则表达式，对正则表达式匹配到的内容进行命名

match():从字符串第一个字符开始匹配，直到不能匹配到为止，并返回匹配到的字符串；如果开头不能匹配则返回NoneType报错信息

例：

a = 'kjksajt3w9#53~59/35(*_dvds~r)3'

m = re.match("\w+",a)

m.group()

search():在所有的字符串中开始进行匹配，返回匹配到的第一个结果

例：

a = 'kjksajt3w9#53~59/35(*_dvds~r)3'

m = re.search("dvd",a)

m.group()

findall():返回所有匹配到的结果；返回一个列表

例：

a = 'kjksajt3w9#53~59/35(*_dvds~r)3'

re.findall("[a-zA-Z]+",a)

split():用匹配到的字符对字符串进行切割；返回一个列表

例：

a = 'kjksajt3w9#53~59/35(*_dvds~r)3'

re.split("\d+",a)

sub():把匹配到的内容进行替换，可以设定替换次数；返回替换后的结果

例：

a = 'kjksajt3w9#53~59/35(*_dvds~r)3'

re.sub('\d+',"|",a,count=3)

group():返回匹配到的结果，常跟在match和search之后

例：

a = 'kjksajt3w9#53~59/35(*_dvds~r)3'

re.match("\w+",a).group()

re.search("dvd",a).group()

compile():把正则表达式进行编译

例：

com = re.compile(r'\d+') #r表示自然字符串，里边的字符不会被转义

e = com.findall('ksdhfkjshdfjkwiu237yyy8w7ye782skdhfkj374ljhfk2')

print(e)

注：可以看到compile编译后返回一个对象，在进行大量匹配的时候，compile效率会更高

groups():分组，即只获取括号内的匹配到的数据；以元组的形式返回

例：

f = re.search('(\d+)hfkjshdfjkwiu(\d+)','ksd234234hfkjshdfjkwiu237yyy8w7ye782')

print(f.groups())

groupdict():以命名方式匹配成功后，同时返回名字和匹配到的内容

例：

o = re.compile(r'(?P<name>\d+)')

m = o.search('127.0.0.1')

m.groupdict()

用正则匹配一条Nginx日志：

日志：

66.249.69.131 - - [10/Aug/2016:03:20:09 +0800] "GET /robots.txt HTTP/1.1" 404 162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

匹配规则：

p = r'(?P<ip>\d{1,3}\.\d{1,3}) .* .* \[(?P<time>.*)\] "(?P<method>\w+) (?P<url>[^\s]*) (?P<version>[\w|/\.\d]*)" (?P<status>\d{3}) (?P<length>\d+) "(?P<refer>[^\s]*)" "(?P<userAgent>.*)"'

匹配结果：

{'ip': '66.249.69.131',

'length': '162',

'method': 'GET',

'refer': '-',

'status': '404',

'time': '10/Aug/2016:03:20:09 +0800',

'url': '/robots.txt',

'userAgent': 'Mozilla/5.0 (compatible; Googlebot/2.1; '

'+http://www.google.com/bot.html)',

'version': 'HTTP/1.1'}

上一篇：正则表达式速查表及常用正则表达式下一篇：正则表达式匹配key-value

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章