频道导航

正则表达式的优化---用RegexBuddy进行效率分析

2020-07-01 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了正则表达式的优化---用RegexBuddy进行效率分析，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

昨天看到《高性能的正则表达式效率优化》一文，自己动手试了试。发觉其优化后的正则表达式仍太罗嗦，自己另写~并用RegexBuddy查看匹配流程。其优化后的正则表达式如下：
^\w+([\.-]\w+)*@\w+([\.-]\w+)*\.\w+([-\.]\w+)*$
该表达式有几个不足之处：
1. 头尾不应该用^$
2. 无须分组，这里用了三个组，若其用于网络爬虫将严重拖慢速度、吞噬内存
3. 没有域名合法性检查
4. @符号前名称判断太罗嗦
5. @符号后二处\w+([.-]\w+)*，明显太累赘
我的正则表达式如下：

\b[\w\.\-]+\b@(?:\b[\w\-]+\.){1,2}[a-zA-Z]{2,3}

测试用文本同前文例子，如图：

点选“Debug”按钮右侧的倒三角，选择“Debug everywhere”,
得到匹配流程分析：

可以看到只有12步，及一个回溯！效率高得多了！！前述五个问题都得到解决。该表达式主要使用\b来匹配一个词的头尾。

几天后，得空又看到这段正则表达式的不足之处，没考虑正则表达式引擎的运行机制：按字符、表达式的顺序执行匹配
最优表达式，在三段域名情形下（admin@open-lib.com.cn）无回溯匹配：

\b[\w\.\-]+\b@\b[\w\-]+\b(?:\.[A-Za-z]{2,3}){1,2}\b

完！快自己动手用RegexBuddy试试吧

上一篇：被误解好久的正则表达式之后向引用下一篇：学习正则表达式心得

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章