如何从页面中提取所有链接,不包括使用Perl的WWW :: Mechanize？

Question

我正在尝试使用WWW :: Mechanize从HTML页面中使用find_all_links()方法提取一些链接.它支持这些标准的匹配:

如何提取除文字"xyz" 之外的所有链接？

Answer 1

您可以使用以下'text_regex'标准:

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);

有关负面预测断言的更多信息,请参阅perldoc perlre.