如何从页面中提取所有链接,不包括使用Perl的WWW :: Mechanize?

pla*_*etp 3 perl www-mechanize

我正在尝试使用WWW :: Mechanize从HTML页面中使用find_all_links()方法提取一些链接.它支持这些标准的匹配:

  • 文本
  • text_regex
  • 网址
  • url_regex
  • url_abs
  • url_abs_regex
    ...

如何提取文字"xyz" 之外的所有链接?

Eug*_*ash 6

您可以使用以下'text_regex'标准:

$mech->find_all_links(text_regex => qr/^(?!xyz$).*$/);
Run Code Online (Sandbox Code Playgroud)

有关负面预测断言的更多信息,请参阅perldoc perlre.