我的代码只返回一个空字符串,我不知道为什么.
import urllib2
def getImage(url):
page = urllib2.urlopen(url)
page = page.read() #Gives HTML to parse
start = page.find('<a img=')
end = page.find('>', start)
img = page[start:end]
return img
Run Code Online (Sandbox Code Playgroud)
它只返回它找到的第一个图像,所以它不是一个非常好的图像刮刀; 那说,我现在的主要目标只是为了能够找到一个图像.我无能为力.
关于使用 ruby 进行屏幕抓取的文章: http://www.igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds/ 它不是抓取图像,但它是一篇好文章,可能会有所帮助。