Python中的图像抓取程序无法按预期运行

use*_*520 5 python image

我的代码只返回一个空字符串,我不知道为什么.

import urllib2

def getImage(url):
    page = urllib2.urlopen(url)
    page = page.read() #Gives HTML to parse

    start = page.find('<a img=')
    end = page.find('>', start)

    img = page[start:end]

return img
Run Code Online (Sandbox Code Playgroud)

它只返回它找到的第一个图像,所以它不是一个非常好的图像刮刀; 那说,我现在的主要目标只是为了能够找到一个图像.我无能为力.

Jak*_*ers 0

关于使用 ruby​​ 进行屏幕抓取的文章: http://www.igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds/ 它不是抓取图像,但它是一篇好文章,可能会有所帮助。