我有一个.net正则表达式,我正在使用
Windows Powershell进行测试.输出如下:
> [System.Text.RegularExpressions.Regex]::Match("aaa aaa bbb","aaa.*?bbb") Groups : {aaa aaa bbb} Success : True Captures : {aaa aaa bbb} Index : 0 Length : 11 Value : aaa aaa bbb
我的期望是使用?量词将导致匹配为aaa bbb,因为a的第二组足以满足表达式.我对非贪婪量词的理解是否有缺陷,或者我测试不正确?
这是一种常见的误解.懒惰量词不保证尽可能短的匹配.它们只确保当前位置的当前量词与整体匹配所需的字符数不匹配.
如果你真的想确保尽可能短的匹配,你需要明确说明.在这种情况下,这意味着代替.* ?,你想要一个匹配任何既不是aaa也不是bbb的子规则.由此产生的正则表达式将是
aaa(?:(?!aaa|bbb).)*bbb