漂亮的汤 div,带有类和 id

Nik*_*ilS 2 python beautifulsoup web-scraping python-2.7

我是初学者,想问如何使用 beautiful soup 从以下类型的代码中提取数据:

<div class="about-book" id="aboutbook">
Blah blah blah
</div>
Run Code Online (Sandbox Code Playgroud)

当存在具有不同 id 的“about-book”和具有不同类名的“aboutbook”时,如何获得“Blah blah blah”。我想要的是类名和 id 的组合。

Pad*_*ham 5

from bs4 import BeautifulSoup

soup = BeautifulSoup("""<div class="about-book" id="aboutbook">
Blah blah blah
</div>""")

print([x.text for x in soup.find_all("div",attrs={"class":"about-book","id":"aboutbook"})])
[u'\nBlah blah blah\n']
Run Code Online (Sandbox Code Playgroud)

如果只有一个:

  print(soup.find("div",attrs={"class":"about-book","id":"aboutbook"}).text)
Run Code Online (Sandbox Code Playgroud)

  • 你也可以做 `attrs={'id': 'aboutbook', 'class': 'about-book'}` 并保存一个 `if` 语句... (3认同)