如何获取特定网站内的所有页面链接?

Dav*_*vid 3 php web-crawler

我想在php中编程以获取我网站中的所有页面链接,因为我想检查我网站的每个页面的pagerank,是否有工具或库或在php中实现的算法来获取所有页面链接具体网站?

Vla*_*adN 6

你可以试试这个:

<?php
  $original_file = file_get_contents("http://www.your_domain.com/page");
  $stripped_file = strip_tags($original_file, "<a>");
  preg_match_all("/<a(?:[^>]*)href=\"([^\"]*)\"(?:[^>]*)>(?:[^<]*)<\/a>/is", $stripped_file, $matches);
?>
Run Code Online (Sandbox Code Playgroud)

$ matches [0]将包含完整的A标签; 例如:<a href="link">text</a>

$ matches [1]将只包含A标签中的HREF; 例如:link

我希望这能帮到您.问候!