kev*_*ham 2 html javascript php web-scraping goutte
如何使用goutte和laraveldata-从<a>链接中抓取属性?
我想刮一个标签,像这样:
<a class="ProfileNav-stat ProfileNav-stat--link u-borderUserColor u-textCenter js-tooltip js-nav u-textUserColor" data-nav="following" href="/rogerhamilton/following" data-original-title="987,358 Following">
Run Code Online (Sandbox Code Playgroud)
在此<a>链接中,我要刮擦data-original-title标签。
我的代码是:
$client = new Client();
// Hackery to allow HTTPS
$guzzleclient = new \GuzzleHttp\Client([
'timeout' => 60,
'verify' => false,
]);
// Hackery to allow HTTPS
$client->setClient($guzzleclient);
$crawler = $client->request('GET', 'url');
$elements = $crawler->filter('.ProfileNav-stat.ProfileNav-stat--link')->each(function($node){
$x = $node->filter('data-original-title');
dd($x);
});
Run Code Online (Sandbox Code Playgroud)
但它不会返回正确的数据。
对于遇到此问题的其他任何人。就像过滤掉链接然后做类似的事情一样简单$node->filter('.classname or #ID')->attr('data-original-title')。
| 归档时间: |
|
| 查看次数: |
1163 次 |
| 最近记录: |