Python - 从html文件中获取所有图像

Question

Python - 从html文件中获取所有图像

use*_*419 8 python image urllib

有人可以帮我解析一个html文件来获取python中文件中所有图像的链接吗？

最好不要使用第三方模块......

谢谢!

Answer 1

Rus*_*ias 10

你可以使用美丽的汤.我知道你说没有第三方模块.但是,这是解析HTML的理想工具.

import urllib2
from BeautifulSoup import BeautifulSoup
page = BeautifulSoup(urllib2.urlopen("http://www.url.com"))
page.findAll('img')

Run Code Online (Sandbox Code Playgroud)

我认为拉塞尔错过了"BeautifulSoup(页面)" (2认同)

Answer 2

Kab*_*bie 10

只使用PSL

from html.parser import HTMLParser
class MyParse(HTMLParser):
    def handle_starttag(self, tag, attrs):
        if tag=="img":
            print(dict(attrs)["src"])

h=MyParse()
page=open("index.html").read()
h.feed(page)

Run Code Online (Sandbox Code Playgroud)

对我来说，这仅适用于“从HTMLParser导入HTMLParser” (2认同)

归档时间：	15 年，2 月前
查看次数：	15660 次
最近记录：	9 年前