我以前问过如何在Groovy这样做。然而,现在我正在Perl重写我的应用程序,因为所有的CPAN库。
@H_403_2@如果页面包含这些链接:
<a href="http://www.google.com">Google</a> <a href="http://www.apple.com">Apple</a>@H_403_2@输出将是:
Google,http://www.google.com Apple,http://www.apple.com@H_403_2@在Perl中最好的方法是什么?
解决方法
请查看使用
WWW::Mechanize模块。它将为您提取您的网页,然后让您轻松地使用URL列表。
my $mech = WWW::Mechanize->new(); $mech->get( $some_url ); my @links = $mech->links(); for my $link ( @links ) { printf "%s,%s\n",$link->text,$link->url; }@H_403_2@很简单,如果您想浏览该页面上的其他网址,那就更简单了。 @H_403_2@Mech基本上是一个对象中的浏览器。