Art*_*Art 3 php web-crawler goutte
你能帮我找到一种方法,使用Goutte从元描述,元关键词和机器人内容中获取内容.另外,我如何定位<link rel="stylesheet" href="">和<script>?
下面是我用来获取<title>内容的PHP :
require_once 'goutte.phar';
use Goutte\Client;
$client = new Client();
$crawler = $client->request('GET', 'http://stackoverflow.com/');
$crawler->filter('title')->each(function ($node) {
$content .= "Title: ".$node->text()."";
echo $content;
});
Run Code Online (Sandbox Code Playgroud)
这是Goutte的链接 - https://github.com/fabpot/goutte
您可以使用:
$crawler->filterXpath('//meta[@name="description"]')->attr('content');
Run Code Online (Sandbox Code Playgroud)