我以前问过如何在Groovy这样做。然而,现在我正在Perl重写我的应用程序,因为所有的CPAN库。
<a href="http://www.google.com">Google</a> <a href="http://www.apple.com">Apple</a>
输出将是:
Google,http://www.google.com Apple,http://www.apple.com
在Perl中最好的方法是什么?
解决方法
请查看使用
WWW::Mechanize模块。它将为您提取您的网页,然后让您轻松地使用URL列表。
my $mech = WWW::Mechanize->new(); $mech->get( $some_url ); my @links = $mech->links(); for my $link ( @links ) { printf "%s,%s\n",$link->text,$link->url; }
很简单,如果您想浏览该页面上的其他网址,那就更简单了。
Mech基本上是一个对象中的浏览器。