小编use*_*242的帖子

尝试使用HTML DOM解析器在Amazon页面上获取主图像

我正在尝试使用HTML DOM Parser来获取"主要"产品图像的图像源,无论解析器指向哪个产品页面.

在每个页面上,该图像似乎具有id"landingImage".你会认为这应该可以解决问题:

$finalarray[$i][2] = $html->find('img[id="landingImage"]', 0)->src;
Run Code Online (Sandbox Code Playgroud)

但没有这样的运气.

我也试过了

    foreach($html->find('img') as $e)
    if (strpos($e,'landingImage') !== false) { 
        $finalarray[$i][2] = $e->src;
    }
Run Code Online (Sandbox Code Playgroud)

我注意到通常图像源有SY300或SX300,所以我这样做:

    foreach($html->find('img') as $e)
    if (strpos($e,'SX300') !== false) { 
        $finalarray[$i][2] = $e->src;
    }
    else if (strpos($e,'SY300') !== false) { 
        $finalarray[$i][2] = $e->src;
    }
Run Code Online (Sandbox Code Playgroud)

不幸的是,一些图像源链接不包含,例如:

http://www.amazon.com/gp/product/B001O21H00/ref=as_li_ss_tl?ie=UTF8&camp=1789&creative=390957&creativeASIN=B001O21H00&linkCode=as2&tag=bmref-20
Run Code Online (Sandbox Code Playgroud)

html php parsing dom amazon

12
推荐指数
1
解决办法
1128
查看次数

标签 统计

amazon ×1

dom ×1

html ×1

parsing ×1

php ×1