我想得到所有div / links / ..的xpath计数,它们的文本与正则表达式匹配.例如:
<span> day 2 night </span> <span> day 4 night </span> <span> day 17 night</span>
我希望能够致电:
sel.get_xpath_count('regexp:day \d night')
并让它返回2.(这是一个简单的例子当然,我想使用各种正则表达式)
这可能,怎么做?
使用dom = protocol,它允许你使用javascript.并且javascript有正则表达式:
# sorry,example in Perl: $sel->get(qq{dom=(function(){ var x = document.getElementsByTagName('span'); var result = []; for (var i=0;i<x.length;i++) { var txt = x[i].innerHTML; if (txt.match(/day \d night/)) { result.push(x[i]); } } return result; })()});