Perl解析HTML表中的链接

Question

Perl解析HTML表中的链接

我正在尝试从HTML中的表中获取链接.通过使用HTML :: TableExtract,我能够解析表并获取文本(即下面的例子中的Ability,Abnormal),但是无法获得表中涉及的链接.例如,

<table id="AlphabetTable">
   <tr>     
   <td>
    <a href="/cate/A/Ability">Ability</a> <span class="count">2650</span>
   </td>  
   <td>
    <a href="/cate/A/Abnormal">Abnormal</a> <span class="count">26</span>
   </td>
</table>

Run Code Online (Sandbox Code Playgroud)

有没有办法使用HTML :: TableExtract获取链接？或者在这种情况下可能使用的其他模块.谢谢

我的部分代码:

$mech->get($link->url());
$te->parse($mech->content);

foreach $ts ($te->tables){
   foreach $row ($ts->rows){
       print @$row[0];     #it only prints text part
                           #but I want its link 
   }
}

Run Code Online (Sandbox Code Playgroud)

Answer 1

yst*_*sth 5

HTML :: LinkExtor,将提取的表文本传递给其解析方法.

my $le = HTML::LinkExtor->new();

foreach $ts ($te->tables){
    foreach $row ($ts->rows){
        $le->parse($row->[0]);
        for my $link_tag ( $le->links ) {
            my ($tag, %links) = @$link_tag;
            # next if $tag ne 'a'; # exclude other kinds of links?
            print for values %links;
        }
    }
}

Run Code Online (Sandbox Code Playgroud)

归档时间：	15 年前
查看次数：	1654 次
最近记录：	15 年前