我正在尝试使用HTML DOM Parser来获取"主要"产品图像的图像源,无论解析器指向哪个产品页面.
在每个页面上,该图像似乎具有id"landingImage".你会认为这应该可以解决问题:
$finalarray[$i][2] = $html->find('img[id="landingImage"]', 0)->src;
Run Code Online (Sandbox Code Playgroud)
但没有这样的运气.
我也试过了
foreach($html->find('img') as $e)
if (strpos($e,'landingImage') !== false) {
$finalarray[$i][2] = $e->src;
}
Run Code Online (Sandbox Code Playgroud)
我注意到通常图像源有SY300或SX300,所以我这样做:
foreach($html->find('img') as $e)
if (strpos($e,'SX300') !== false) {
$finalarray[$i][2] = $e->src;
}
else if (strpos($e,'SY300') !== false) {
$finalarray[$i][2] = $e->src;
}
Run Code Online (Sandbox Code Playgroud)
不幸的是,一些图像源链接不包含,例如:
http://www.amazon.com/gp/product/B001O21H00/ref=as_li_ss_tl?ie=UTF8&camp=1789&creative=390957&creativeASIN=B001O21H00&linkCode=as2&tag=bmref-20
Run Code Online (Sandbox Code Playgroud)