频道导航

检测正则表达式是否呈指数级

2020-07-11 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了检测正则表达式是否呈指数级，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

这个 article表明在回溯时有一些正则表达式为O(2 ^ n).
例子是(x x)y.
当尝试匹配像xxxx …这样的字符串时,它会回溯一段时间,然后才发现它无法匹配.

有没有办法检测这样的正则表达式？

谢谢

如果你的正则表达式引擎暴露了(x x)y的运行时指数行为,那么它就会被破坏,因为DFA或NFA可以在线性时间内识别出这种模式：

echo "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" | egrep "(x+x+)+y"
echo "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxy" | egrep "(x+x+)+y"

都立即回答.

实际上,只有少数情况(如反向引用)确实需要回溯(主要是因为具有反向引用的正则表达式不再是语言理论意义上的正则表达式).只有在给出这些极端情况时,有能力的实现才应切换到回溯.

公平地说,DFA也有一个黑暗的一面,因为一些正则表达式具有指数大小要求,但是尺寸约束比时间约束更容易实施,并且巨大的DFA在输入上运行线性,因此它比小型回溯窒息更便宜在几个X的.

你应该阅读关于regexp(以及回溯的病理行为)的实现的Russ Cox优秀文章系列：http://swtch.com/~rsc/regexp/

要回答关于可判定性的问题：你做不到.因为regexpr没有一个回溯.每个实现都有自己的策略来处理某些情况下算法的指数增长,而不涉及其他情况.一条规则可能适合这里,也可能是灾难性的.

更新：

例如,一个实现可以包含一个优化器,它可以在执行它们之前使用代数转换来简化正则表达式：(x x)y与xxx * y相同,这对于任何回溯都不应该是一个问题.但是同样的优化器不会识别下一个表达式,问题又出现了.在这里有人描述了如何制作一个愚弄Perl优化器的regexpr：

http://perlgeek.de/blog-en/perl-tips/in-search-of-an-exponetial-regexp.html

上一篇：正则表达式 – vba积极向前看太贪心下一篇：regex – 用于识别文本引用的正则表

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章