Python Beautifulsoup img标签解析

Tom*_*Joy 5 python image beautifulsoup

我正在使用 beautifulsoup 来解析“www.youtube.com”中存在的所有 img 标签

代码是

import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://www.youtube.com/')
soup = BeautifulSoup(page)
tags=soup.findAll('img')
Run Code Online (Sandbox Code Playgroud)

但是我没有得到所有的 img 标签。获取 img 标签也是无效的。

解析后得到的img标签与页面源img标签不同。缺少某些属性。

我需要在 youtube.com 中获取所有视频 img 标签

请帮忙

Nic*_*ood 5

当我在这里尝试时似乎有效

import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://www.youtube.com/')
soup = BeautifulSoup(page)
tags=soup.findAll('img')
print "\n".join(set(tag['src'] for tag in tags))
Run Code Online (Sandbox Code Playgroud)

产生这个对我来说看起来不错

http://i1.ytimg.com/vi/D9Zg67r9q9g/market_thumb.jpg?v=723c8e
http://s.ytimg.com/yt/img/pixel-vfl3z5WfW.gif
//s.ytimg.com/yt/img/pixel-vfl3z5WfW.gif
/gen_204?a=fvhr&v=mha7pAOfqt4&nocache=1337083207.97
http://i3.ytimg.com/vi/fNs8mf2OdkU/market_thumb.jpg?v=4f85544b
http://i4.ytimg.com/vi/CkQFjyZCq4M/market_thumb.jpg?v=4f95762c
http://i3.ytimg.com/vi/fzD5gAecqdM/market_thumb.jpg?v=b0cabf
http://i3.ytimg.com/vi/2M3pb2_R2Ng/market_thumb.jpg?v=4f0d95fa
//i2.ytimg.com/vi/mha7pAOfqt4/hqdefault.jpg
Run Code Online (Sandbox Code Playgroud)


Chr*_*tts 0

明确使用soup.findAll(name='img')对我有用,而且我似乎没有遗漏页面中的任何内容。