漂亮的汤 div，带有类和 id

Question

漂亮的汤 div，带有类和 id

Nik*_*ilS 2 python beautifulsoup web-scraping python-2.7

我是初学者，想问如何使用 beautiful soup 从以下类型的代码中提取数据：

<div class="about-book" id="aboutbook">
Blah blah blah
</div>

Run Code Online (Sandbox Code Playgroud)

当存在具有不同 id 的“about-book”和具有不同类名的“aboutbook”时，如何获得“Blah blah blah”。我想要的是类名和 id 的组合。

Answer 1

Pad*_*ham 5

from bs4 import BeautifulSoup

soup = BeautifulSoup("""<div class="about-book" id="aboutbook">
Blah blah blah
</div>""")

print([x.text for x in soup.find_all("div",attrs={"class":"about-book","id":"aboutbook"})])
[u'\nBlah blah blah\n']

Run Code Online (Sandbox Code Playgroud)

如果只有一个：

  print(soup.find("div",attrs={"class":"about-book","id":"aboutbook"}).text)

Run Code Online (Sandbox Code Playgroud)

你也可以做 `attrs={'id': 'aboutbook', 'class': 'about-book'}` 并保存一个 `if` 语句... (3认同)

归档时间：	11 年，1 月前
查看次数：	10639 次
最近记录：	4 年，8 月前