Python中的图像抓取程序无法按预期运行

Question

Python中的图像抓取程序无法按预期运行

我的代码只返回一个空字符串,我不知道为什么.

import urllib2

def getImage(url):
    page = urllib2.urlopen(url)
    page = page.read() #Gives HTML to parse

    start = page.find('<a img=')
    end = page.find('>', start)

    img = page[start:end]

return img

Run Code Online (Sandbox Code Playgroud)

它只返回它找到的第一个图像,所以它不是一个非常好的图像刮刀; 那说,我现在的主要目标只是为了能够找到一个图像.我无能为力.

Answer 1

Jak*_*ers 0

关于使用 ruby 进行屏幕抓取的文章： http://www.igvita.com/2007/02/04/ruby-screen-scraper-in-60-seconds/ 它不是抓取图像，但它是一篇好文章，可能会有所帮助。

归档时间：	13 年，2 月前
查看次数：	359 次
最近记录：	13 年，2 月前