想象一下,我正在尝试使用Perl正则表达式解析以下html:
@H_301_7@
@H_301_7@
<h4>test</h4> <p>num1</p> <p>num2</p> <p>num3</p> <h4>test</h4> <p>num1</p> <p>num2</p> <p>num3</p> <p>num4</p>@H_301_7@使用以下正则表达式: @H_301_7@
<h4>([\w\s]*)</h4>(?:<p>([\w\s]+)</p>)+@H_301_7@编号组如何在Perl中构建? 1美元显然会包含< h4>标记文本,但是当捕获组重复时,捕获的< p>标签然后发送到2美元3美元和4美元?是否有一种很好的方法可以捕获所有< p>数组中的标签?这甚至是perl支持的东西吗?或者我被强制为< h4>写一个正则表达式,然后为< p>创建另一个正则表达式? @H_301_7@(我知道我可以使用HTML :: Tree或类似的东西来解析html,但这只是我用来帮助描述问题的一个简单例子,我真的只对重复编号的捕获组如何工作感兴趣在Perl)