我正在尝试从HTML中的表中获取链接.通过使用HTML :: TableExtract,我能够解析表并获取文本(即下面的例子中的Ability,Abnormal),但是无法获得表中涉及的链接.例如,
<table id="AlphabetTable">
<tr>
<td>
<a href="/cate/A/Ability">Ability</a> <span class="count">2650</span>
</td>
<td>
<a href="/cate/A/Abnormal">Abnormal</a> <span class="count">26</span>
</td>
</table>
Run Code Online (Sandbox Code Playgroud)
有没有办法使用HTML :: TableExtract获取链接?或者在这种情况下可能使用的其他模块.谢谢
我的部分代码:
$mech->get($link->url());
$te->parse($mech->content);
foreach $ts ($te->tables){
foreach $row ($ts->rows){
print @$row[0]; #it only prints text part
#but I want its link
}
}
Run Code Online (Sandbox Code Playgroud)
HTML :: LinkExtor,将提取的表文本传递给其解析方法.
my $le = HTML::LinkExtor->new();
foreach $ts ($te->tables){
foreach $row ($ts->rows){
$le->parse($row->[0]);
for my $link_tag ( $le->links ) {
my ($tag, %links) = @$link_tag;
# next if $tag ne 'a'; # exclude other kinds of links?
print for values %links;
}
}
}
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1654 次 |
| 最近记录: |