相关疑难解决方法(0)

Python 2.7美丽的汤Img Src Extract

for imgsrc in Soup.findAll('img', {'class': 'sizedProdImage'}):
    if imgsrc:
        imgsrc = imgsrc
    else:
        imgsrc = "ERROR"

patImgSrc = re.compile('src="(.*)".*/>')
findPatImgSrc = re.findall(patImgSrc, imgsrc)

print findPatImgSrc

'''
<img height="72" name="proimg" id="image" class="sizedProdImage" src="http://imagelocation" />
Run Code Online (Sandbox Code Playgroud)

这就是我想从中提取的内容,我得到了:

findimgsrcPat = re.findall(imgsrcPat, imgsrc)
File "C:\Python27\lib\re.py", line 177, in findall
    return _compile(pattern, flags).findall(string)
TypeError: expected string or buffer
Run Code Online (Sandbox Code Playgroud)

"""

python beautifulsoup

20
推荐指数
2
解决办法
3万
查看次数

如何在 beautifulsoup 中抓取 image-src

我正在尝试在此代码中获取 image-src:

<img alt='Original Xiaomi Redmi Note 5 4GB RAM 64GB ROM Snapdragon S636 Octa Core Mobile Phone MIUI9 5.99" 2160*1080 4000mAh 12.0+5.0MP(China)' class="picCore" id="limage_32856997152" image-src="//ae01.alicdn.com/kf/HTB1WDJZbE_rK1Rjy0Fcq6zEvVXaS/Original-Xiaomi-Redmi-Note-5-4GB-RAM-64GB-ROM-Snapdragon-S636-Octa-Core-Mobile-Phone-MIUI9.jpg_220x220xz.jpg" itemprop="image"/>
Run Code Online (Sandbox Code Playgroud)

我试过这段代码,但它不起作用:

图像 = 汤.find('img').get('image-src')

通常我使用get('src')它并且它有效但问题在这里:我需要使用不起作用的 image-src 。

python beautifulsoup

6
推荐指数
2
解决办法
9459
查看次数

Python Beautifulsoup img标签解析

我正在使用 beautifulsoup 来解析“www.youtube.com”中存在的所有 img 标签

代码是

import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://www.youtube.com/')
soup = BeautifulSoup(page)
tags=soup.findAll('img')
Run Code Online (Sandbox Code Playgroud)

但是我没有得到所有的 img 标签。获取 img 标签也是无效的。

解析后得到的img标签与页面源img标签不同。缺少某些属性。

我需要在 youtube.com 中获取所有视频 img 标签

请帮忙

python image beautifulsoup

5
推荐指数
2
解决办法
2万
查看次数

标签 统计

beautifulsoup ×3

python ×3

image ×1