Nik*_*ilS 2 python beautifulsoup web-scraping python-2.7
我是初学者,想问如何使用 beautiful soup 从以下类型的代码中提取数据:
<div class="about-book" id="aboutbook">
Blah blah blah
</div>
Run Code Online (Sandbox Code Playgroud)
当存在具有不同 id 的“about-book”和具有不同类名的“aboutbook”时,如何获得“Blah blah blah”。我想要的是类名和 id 的组合。
from bs4 import BeautifulSoup
soup = BeautifulSoup("""<div class="about-book" id="aboutbook">
Blah blah blah
</div>""")
print([x.text for x in soup.find_all("div",attrs={"class":"about-book","id":"aboutbook"})])
[u'\nBlah blah blah\n']
Run Code Online (Sandbox Code Playgroud)
如果只有一个:
print(soup.find("div",attrs={"class":"about-book","id":"aboutbook"}).text)
Run Code Online (Sandbox Code Playgroud)