小编iDe*_*ion的帖子

使用BeautifulSoup从`img`标签中提取`src`属性

<div class="someClass">
    <a href="href">
        <img alt="some" src="some"/>
    </a>
</div>
Run Code Online (Sandbox Code Playgroud)

我使用bs4而我无法使用a.attrs['src']src,但我可以得到href.我该怎么办?

python regex bs4

13
推荐指数
4
解决办法
3万
查看次数

如何使用XPath提取href?

HTML结构是这样的:

<div class="image">
  <a target="_top" href="someurl">
    <img class="_verticallyaligned" src="cdn.translte" alt="">
  </a>
  <button class="dui-button -icon" data-shop-id="343170" data-id="14145140">
    <i class="dui-icon -favorite"></i>
  </button>
</div>
Run Code Online (Sandbox Code Playgroud)

提取文本的代码:

buyers = doc.xpath("//div[@class='image']/a[0]/text()")
Run Code Online (Sandbox Code Playgroud)

输出为:

[] 
Run Code Online (Sandbox Code Playgroud)

我做错什么了?

python xpath lxml scrapy

0
推荐指数
1
解决办法
1426
查看次数

标签 统计

python ×2

bs4 ×1

lxml ×1

regex ×1

scrapy ×1

xpath ×1