此Perl脚本的目的是使用wget和Perl从网页中提取信息。在这种情况下,这是我尝试从以下网站提取信息的网站:https://nocable.org/tv-listings/bm95-pomona-ca-91768
我只想显示标题。例如,
2.1 - The Ellen Degeneress Show
4.1 - NBC News
7.1 - Hell's Kitchen
就是这样。
这是我到目前为止的内容,但是我不确定我是对还是错。任何人都可以在仅显示标题的2.1、4.1和7.1频道上提供帮助或提供建议吗?特别是wget和Perl脚本。感谢任何回应,因为我仍在学习Perl。
use warnings;
use strict;
use feature 'say';
use LWP::Simple;
use HTML::TableExtract;
use open qw(:encoding(UTF-8) :std);
my $url = ' https://nocable.org/tv-listings/bm95-pomona-ca-91768';
my $page = get($url) or die "Can't load $url: $!";
my $tec = HTML::TableExtract->new();
$tec->parse($page);
foreach my $rowref ($tec->rows)
{
next if not @$rowref;
# Clean up undefined/whitespace/newlines,often found in HTML
my @row = map {
$_ = '' if not defined; # keep undefined fields for formatting
s/^\s*|\s*$//g; #/ leading and trailing whitespace
s/\s+|\n/ /g; # multiple spaces,newlines
$_ # return it
} @$rowref;
say join ' | ',@row;
}