问题是我想匹配评论任何一方的所有文本并排除评论本身.
有很多“评论”相关的正则表达式帖子,但大多数是其他语言(我使用记事本,维基百科告诉我是POSIX ERE,我们不讨论语言或工具),大多数都专注于查找评论,我有完成了.
这将找到我想要的包含文本(这将包括匹配中的内部块注释):
(^)rule ((.|\n|\r)*?)(^)end
上面找到了’rule’和’end’之间的任何内容,包括在内.精细.
这将找到块评论:
(?:/\*(?:(?:[^*]|\*(?!/))*)\*/)
上面找到了/ *和* /之间的任何内容.精细.我不担心评论中是否有* /,而不是我的案例中的问题.
现在的问题是如何在上面的正规则匹配中间将块注释置为负数,以便它匹配RULE和END之间的所有内容,除了注释文本?
解决方法
首先让我说:正则表达式不是为了做到这一点!
但这并非不可能:它可以通过递归正则表达式完成:
>匹配从“规则”到“结束”OR的所有内容或者注释块的开头,在进一步匹配所有内容之后“结束”或注释块的开始,在进一步匹配所有内容之后“结束”或等等. .
当然只捕捉’每个人’
这意味着:
^rule((?:.|\r|\n)*?)(?:^end|(?:(?://$|/\*(?:(?:[^*]|\*(?!/))*)\*/))) ^ put cursor there and insert ((?:.|\r|\n)*?)(?:^end|(?:(?://$|/\*(?:(?:[^*]|\*(?!/))*)\*/))) or end with (?:\r?\n^end)
然后换成
$1 $2 $3 $$4 ..
测试记事本的限制我创建了这个小提琴:
http://jsfiddle.net/lovinglobo/wPKjb/
只需说出“无效的正则表达式”,记事本就会超过29次递归.