说,我有一行包含以下字符串:
"$tom" said blah blah blash. "$dick" said "blah blah blah". "$harry" said blah blah blah.
我想提取
"$dick" said "blah blah blah"
我有如下代码:
my ($term) = /(".+?" said ".+?")/g; print $term;
但它比我需要的更多:
"$tom" said blah blah blash. "$dick" said "blah blah blah"
我尝试通过使用非捕获括号将我的模式作为一个整体进行分组:
my ($term) = /((?:".+?" said ".+?"))/g;
但问题仍然存在.
我重读了学习Perl的Nongreedy Quantifiers部分,但到目前为止我还没有.
感谢任何指导,你可以慷慨地提供:)
解决方法
问题是,即使不是贪心,它仍然在努力.正则表达式看不到
"$tom" said blah blah blash.
并认为“哦,跟随”说“的东西没有引用,所以我跳过那个.”它认为“好了,”说“之后的东西没有引用,所以它仍然是我们报价的一部分.”所以“.”火柴
"$tom" said blah blah blash. "$dick"
你想要的是“[^”]“,这将匹配两个引号,其中包含不是引号的任何东西,所以最终的解决方案是:
("[^"]+" said "[^"]+")